当前位置: 首页 > news >正文

String 学习总结

1. 存储机制

  • 短字符串优化(SSO, Small String Optimization)
    现代标准库中的字符串实现普遍采用 SSO 技术,将长度较短(例如 ≤15 字节)的字符串数据直接存储在字符串对象内部的固定缓冲区(栈上)。这样避免了频繁的堆内存分配,提高性能。

  • 堆内存存储
    当字符串长度超过内部缓冲区容量时,字符串数据会存储在堆上,通过指针引用。此时,字符串对象内保存的是指向堆内存的指针、当前长度和容量等元信息。


2. 重要属性

属性说明
size/length当前字符串实际使用的字符数
capacity当前分配的最大存储字符数(通常 ≥ size)
buffer指向字符串数据的指针,或者内部缓冲区(SSO时)
null terminatorC风格字符串中,以 '\0' 作为结束标志,std::string 内部通常会保证有一个多余空间存储该字符

3. 内存管理与容量策略

  • capacity 分配原则
    容量通常会大于当前字符串长度,目的是减少频繁的内存重新分配,提高追加操作效率。
    常见扩容策略:

    • 按固定比例扩容(如1.5倍、2倍)
    • 扩容到下一个合适的大小(例如2的幂次方)
  • 分配大小
    一般分配空间为 capacity + 1,多出的一字节用于存放 '\0',确保兼容 C 风格字符串操作。


4. 拷贝与赋值机制

4.1 深拷贝(Deep Copy)

  • 每次拷贝都会分配新的内存,并复制字符串内容,保证拷贝对象独立,安全但性能开销大。
  • 适用于早期设计和多线程环境。

4.2 共享内存 + 写时复制(Copy-On-Write, COW)

  • 多个字符串对象共享同一块数据内存。只有在某个对象试图修改数据时,才真正进行内存拷贝。
  • 可以减少内存使用,提升性能。
  • 缺点:需要维护引用计数,存在多线程安全风险。
  • 目前 C++11 及以后版本的标准库大多数已经废弃了 COW 机制,转为更简单且线程安全的设计。

5. 其他核心特性

5.1 移动语义支持(C++11 及以后)

  • 移动构造函数和移动赋值运算符,允许字符串的资源(内存指针)从一个对象转移到另一个对象,避免内存拷贝,显著提升性能。

5.2 不可变性 vs 可变性

  • C++ std::string 是可变的,允许修改字符串内容。
  • Java String 是不可变的,一旦创建,字符串内容不可更改,所有修改操作都会返回新的字符串对象。
  • 不同的设计影响内存管理和实现方式。

5.3 编码与字符宽度

  • std::string 本质是字节序列,默认按 ASCII 或 UTF-8 存储,字符数量和字节数不一定相等。
  • Unicode 相关的字符串类(如 std::u16string, std::wstring)处理多字节或宽字符,存储和访问更复杂。

5.4 线程安全

  • 标准库的字符串操作在多线程环境中通常不是完全线程安全的。
  • 多线程共享字符串时,需额外同步机制。

6. 常见面试问点总结

  • 你知道什么是 Small String Optimization 吗?它解决了什么问题?
  • 深拷贝和写时复制有什么区别?为什么现代库一般弃用写时复制?
  • 字符串的容量和长度有什么区别?为什么需要容量?
  • 讲讲 C++11 以后字符串的移动语义带来了哪些性能提升?
  • 字符串为什么需要以 ‘\0’ 结尾?是不是所有字符串都必须?
  • 如何避免字符串频繁的内存分配?
  • 你知道不同语言的字符串实现有什么不同吗?(可变 vs 不可变)
  • 多线程环境下字符串操作有哪些注意点?
http://www.lqws.cn/news/113797.html

相关文章:

  • LangChain基本概念
  • Spring @Value注解的依赖注入实现原理
  • 使用 Python 制作 GIF 动图,并打包为 EXE 可执行程序
  • 3步在小米13手机跑DeepSeek R1
  • MaxCompute开发UDF和UDTF案例
  • 洛谷P12610 ——[CCC 2025 Junior] Donut Shop
  • 【知识点】openai请求参数如何转为大模型的字符串?
  • LeetCode[404]左叶子之和
  • JavaScript 核心原理深度解析-不停留于表面的VUE等的使用!
  • Servlet 生命周期
  • 关于easyx头文件
  • 二、函数调用包含单个参数之整型-ECX寄存器,LEA指令
  • SQL注入漏洞-上篇
  • 春秋云镜 Certify Writeup
  • 光耦电路学习,光耦输入并联电阻、并联电容,光耦输出滤波电路
  • 对比ODR直接赋值的非原子操作和BSRR原子操作
  • 蓝桥杯国赛训练 day1
  • BGP笔记的基本概要
  • Abaqus连接器弹片正向力分析:
  • 【高等数学】(2)函数
  • 域自适应 (Domain Adaptation,DA)基础
  • Ubuntu系统 | 本地部署ollama+deepseek
  • MySQL存储过程
  • MySQL 搜索特定桩号距离之间的数据
  • 传输层协议:网络通信的关键纽带
  • 12.7 LangChain实战:1.2秒响应!用LCEL构建高效RAG系统,准确率提升41%
  • 现代密码学介绍
  • 从0开始学linux韦东山教程第四章问题小结(3)
  • 【LUT技术专题】图像自适应3DLUT代码讲解
  • 蛋白质设计软件LigandMPNN介绍