`
mryufeng
  • 浏览: 981887 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

丢人的strncpy 语义理解错误

阅读更多
今天发现strncpy使用上的一个古怪bug, 解决了是发现对strncpy的语义理解错误。

SYNOPSIS
       #include <string.h>

       char *strcpy(char *dest, const char *src);

       char *strncpy(char *dest, const char *src, size_t n);

DESCRIPTION
       The  strcpy()  function  copies the string pointed to by src (including
       the terminating '\0' character) to the array pointed to by  dest.   The
       strings  may not overlap, and the destination string dest must be large
       enough to receive the copy.

       The strncpy() function is similar, except that not more than n bytes of
       src  are copied. Thus, if there is no null byte among the first n bytes
       of src, the result will not be null-terminated.

       In the case where the length of src is less than that of n, the remain-
       der of dest will be padded with null bytes.



请非常注意上面的红字:
1. 低效率的padding 因为常规情况下buffer要比实际的字符串大的多,所以无辜的填充。
2. 一旦不小心你的n 比 buffer的长度大 那就死惨了 内存狂越界写。
这种情况经常发生在你把buffer的长度改小了 但是后面的n没有相应地改。

相信很多人会遭受这个使用bug.

分享到:
评论
16 楼 lhyasia 2008-07-30  
mryufeng 写道
to messup: 估计你这么理解 一用就错了


具体一点? 我觉得messup说得挺好的
15 楼 mryufeng 2008-06-26  
原来这个还是有故事的,请看:

[程序]朱照远(Joshua Zhu) - 拜Igor神,拜Roberto神 说: (2008-06-26 15:23:38)
http://en.wikipedia.org/wiki/Strlcpy
[程序]朱照远(Joshua Zhu) - 拜Igor神,拜Roberto神 说: (2008-06-26 15:23:56)
原来是来自与OpenBSD
[程序]朱照远(Joshua Zhu) - 拜Igor神,拜Roberto神 说: (2008-06-26 15:27:01)
每个serious的网络程序都自己写一个或者copy一份
14 楼 mryufeng 2008-06-19  
to messup: 估计你这么理解 一用就错了
13 楼 messup 2008-06-19  
这个根本就不是bug,C程序员有责任对char*的结尾\0做控制,这个是程序员的责任。C里常做的事情就是从多个psrc中拷贝n个字符,拼接到pdest不同位置最后生成需要的字符串,最后一般都是自己加个结束0。
12 楼 mryufeng 2008-06-16  
问题是n家族的字符串函数是不是大家都了解语义 都不会用错?
11 楼 jemyzhang 2008-06-16  
归根结底还是出在程序员身上。
10 楼 mryufeng 2008-06-12  
这个不是指库的bug 库实现的很好 只是感觉程序员容易把它用错
9 楼 seen 2008-06-12  
内存越界倒不算什么问题 因为这实在太常见了 c本来就假设程序员是上帝的

不过“padded with null bytes”的确有点意思 没看出来有啥必要
毕竟c里面很多库函数,以及linux很多系统调用都不会主动帮你清空一块内存的

话说回来 无论如何这不是bug 因为这种行为是符合定义的
8 楼 mryufeng 2008-06-12  
就是不明白库的作者为什么这么设计 不符合c的习惯哦
7 楼 mryufeng 2008-06-12  
看了vc crt和gcc glibc的代码 循环填0的 这个buffer如果比较大的话 占用的开销比字符串本身要大的太多 所以在高级服务器里面 就要很谨慎使用这个函数。 很多服务器都是自己实现的这个函数,比如nginx, haproxy等。
6 楼 coolmenu 2008-06-12  
用sizeof(buf),代替 n,能减少越界问题
5 楼 albertlee 2008-06-12  
填一堆的\0  效率上应该不会差多少,cpu指令好像有优化。不过越界的问题是个隐患
4 楼 mryufeng 2008-06-12  
看清楚了 是在dest里面填充n - strlen(src)的长度的0 这个非常低效率 而且容易出bug 实际上按我理解填个0就可以了.
3 楼 ray_linn 2008-06-12  
....这也叫bug...你应该自己分配足够的空间来存下你的source,不然你以为你是在用java吗?
或者是VC++里的safe strcpy
2 楼 刑天战士 2008-06-12  
这算什么BUG……C早就说过caller有责任保证buffer不overflow
1 楼 iunknown 2008-06-12  
mryufeng 写道

2. 一旦不小心你的n 比 buffer的长度大 那就死惨了 内存狂越界写。
这种情况经常发生在你把buffer的长度改小了 但是后面的n没有相应地改。

相信很多人会遭受这个bug.



这里导致的问题通常在于 dest 没有以 \0 结尾,如果接下来对 dest 的处理依赖于这个结尾的 \0 ,就可能导致越界的读,这个的确会有人遇到。
但另一方面,这里提到越界写,这个是因为 n 和 dest 的实际长度不符,这个算不上是 strncpy 的 bug 吧,是写程序的人的问题。

相关推荐

    语义理解项目( VS2017+灵云NLU语义理解项目)

    语义理解项目是一个结合了Visual Studio 2017开发环境和灵云(QingCloud)自然语言理解(NLU)技术的应用实例。这个项目旨在帮助开发者理解和实践如何利用NLU技术来实现智能交互功能。在自然语言处理领域,语义理解...

    微信语义理解协议文档

    7. **错误处理**:讲解在处理语义理解过程中可能出现的错误情况及对应的处理方法。 8. **更新日志**:记录协议的版本变更,方便开发者追踪最新的改进和修复。 掌握微信语义理解协议,不仅可以提升小程序的用户体验...

    讯飞语义理解Demo

    【讯飞语义理解Demo】是科大讯飞公司推出的一款用于展示其在语义理解技术方面的应用实例。科大讯飞是中国领先的语音和人工智能技术提供商,尤其在语音识别、自然语言处理(NLP)等领域有着深厚的技术积累。在这个...

    对话系统和语义理解技术

    语义理解面临许多挑战,包括语音识别错误、口语中的错误和重复、歧义性问题以及自然语言表达的多样性等。例如,用户说“明早八点叫我起床”时可能会出现歧义,因为“八点”可以是早上也可以是晚上。而“我要听白雪...

    Chatopera 语义理解系统:机器学习,聊天机器人,意图识别

    Chatopera 语义理解系统:机器学习,聊天机器人,意图识别 Chatopera 语义理解系统:机器学习,聊天机器人,意图识别 Chatopera 语义理解系统:机器学习,聊天机器人,意图识别 Chatopera 语义理解系统:机器学习,...

    基于知识图谱的文本语义理解及其智能应用

    知识图谱的核心是通过实体、属性和实体间的关系来组织知识,它能够帮助机器理解世界,并为各种智能应用提供语义支持。北京大学的研究人员赵东岩在知识图谱领域所做的工作,特别是将其应用于文本语义理解,对于推动...

    基于语义理解和机器学习的混合的中文文本情感分类算法框架

    该文件介绍了一种新的中文文本情感分类算法框架,该框架融合了语义理解和机器学习技术。以下是对标题、描述和部分内容中提及的关键知识点的详细说明: 1. 中文文本情感分类: 中文文本情感分类是自然语言处理(NLP...

    1-1知识增强图语义理解技术.pdf

    知识增强图语义理解技术是近年来在自然语言处理领域中发展出的一种先进的技术,它结合了图神经网络和预训练模型的优势,旨在提高文本的理解深度和准确性。在本资料中,重点介绍了百度的ERNIE(Enhanced ...

    ChatGPT技术与语义理解的关联性探讨.docx

    ChatGPT 技术与语义理解的关联性探讨 ChatGPT 技术是一种基于生成式预训练模型的自然语言处理技术,它能够通过与人类对话来完成各种任务,如回答问题、生成文本等。语义理解则是指对文本中的语义进行解析和理解的...

    ChatGPT技术与语义理解的结合应用.docx

    ChatGPT 技术与语义理解的结合应用 ChatGPT 技术是一种基于语言模型的生成式对话系统,具备生成和回答问题的能力,并且能够进行流畅的对话。然而,ChatGPT 技术在一些复杂语义理解的场景中还存在一定的局限性。本文...

    ChatGPT技术与语义理解的结合研究.docx

    ChatGPT技术与语义理解的结合研究 ChatGPT 技术是基于 GPT 模型发展而来的一种对话生成模型,旨在生成逼真对话。但是,在实际应用中,ChatGPT 技术也面临着一些挑战,其中最显著的就是语义理解的不足。为了克服这...

    ChatGPT技术对于语义理解和语义生成的贡献.docx

    ChatGPT 技术对于语义理解和语义生成的贡献 ChatGPT 技术是近年来人工智能领域中最受关注的技术之一,它在语义理解和语义生成方面展现出了巨大的潜力和贡献。该技术通过深度学习的方式进行语义理解和生成,能够识别...

    ChatGPT技术的实时语义理解优化.docx

    ChatGPT 技术的实时语义理解优化 【知识点一:自然语言处理技术的发展】 ChatGPT 作为自然语言处理技术的一项重要成果,具有实时进行语义理解的能力,为社交媒体平台、智能助手等应用提供了广泛的可能性。然而,...

    ChatGPT技术与语义理解模型的结合研究与实践.docx

    "ChatGPT技术与语义理解模型的结合研究与实践" 一、ChatGPT技术概述 ChatGPT是一种基于GPT框架的对话生成模型,由OpenAI公司开发。它通过大规模的预训练数据和无监督学习的方式进行训练,可以生成流畅的对话。...

    ChatGPT技术与对话语义理解的结合应用研究.docx

    ChatGPT技术与对话语义理解的结合应用研究 ChatGPT 技术简介:ChatGPT 是一种基于生成模型的对话系统,它能够根据输入信息生成连贯、自然的回复。与传统对话系统相比,ChatGPT 更擅长自由对话,而非仅仅做出有限的...

    "语音识别+语义理解"一站式解决方案(iOS)

    在IT行业中,语音识别与语义理解是两个关键的技术领域,它们在人机交互和智能设备中发挥着重要作用。云知声作为一家领先的AI企业,提供了"语音识别+语义理解"的一站式解决方案,特别为iOS平台设计,极大地简化了...

    基于知识图谱的语义理解技术及应用(来自于DataFunTalk年终论坛).pdf

    同时,随着文本、语音、视觉等智能技术的不断深入,知识图谱在复杂知识表示、多模语义理解技术与应用等方面都面临新的挑战与机遇。本文将介绍百度基于知识图谱,从文本到多模态内容的理解技术及应用的最新进展。

    基于transformer的3D图像语义理解.zip

    基于transformer的3D图像语义理解 本项目是一个基于transformer的3D图像语义理解系统,旨在通过先进的深度学习技术,为用户提供高效、准确的3D图像语义分析服务。项目利用transformer模型处理3D图像数据,实现对场景...

Global site tag (gtag.js) - Google Analytics