主题
基础概念
自然语言处理(Natural Language Processing, NLP)是人工智能的重要分支,致力于让计算机能够理解、生成和处理人类语言。
一、什么是自然语言处理
自然语言处理的核心目标是让计算机“理解”人类语言,从中提取有用的信息并进行合理的响应。
它涉及语言的多个层面:
层面 | 说明 | 示例 |
---|---|---|
语音层 | 语音识别与合成 | 语音助手、听写系统 |
词法层 | 分词、词性标注 | “我/爱/自然语言处理” |
句法层 | 语法结构分析 | 主谓宾结构识别 |
语义层 | 词义理解、消歧义 | “苹果”指公司还是水果? |
篇章层 | 上下文与语篇理解 | 段落、对话、情感分析 |
二、NLP 的发展历程
基于规则阶段(1950s–1980s)
使用人工编写的语言规则,如语法树、正则匹配。代表系统:ELIZA。统计学习阶段(1990s–2010s)
利用大规模语料与机器学习算法(如 HMM、CRF、SVM)。
代表应用:搜索引擎、拼写检查、词性标注。神经网络与深度学习阶段(2010s 至今)
RNN、LSTM 到 Transformer 的演进,使模型能捕捉上下文语义。
代表模型:Word2Vec、BERT、GPT、T5 等。
三、NLP 的核心研究方向
- 语言理解(NLU):分类、命名实体识别、问答、情感分析
- 语言生成(NLG):机器翻译、摘要生成、对话系统、文本续写
- 信息抽取与检索:从海量文本中获取关键信息
- 多模态处理:语言与图像、语音的联合理解
四、NLP 的应用实例
- 智能客服 / 聊天机器人
- 搜索引擎文本理解
- 智能写作与内容推荐
- 法律、医疗、金融领域的文档分析
- 语音转文字、智能翻译等
五、小结
NLP 是让机器理解人类语言的桥梁。
随着大模型(如 GPT、Gemini、Claude)的出现,NLP 的边界不断拓宽,已成为 AI 时代的关键技术基础。