从56个术语和架构图,剖析AI现状
<p>在学习时,我习惯先对所学内容构建一个整体框架,以便清楚自己掌握的知识在整个生态或结构中的位置。<br />在网上搜索了许多 AI 架构图后,我没找到满意的图示,于是结合 AI 工具和自身理解,绘制了一张人工智能架构图,并整理了相关知识点。<br />
架构图涵盖 56 个行业术语,分为核心技术、支撑技术生态、系统与架构、AI 应用技术、未来发展方向、伦理与安全 6 大模块。<br />
人工智能是一个广阔的知识领域,这 56 个术语无法完全覆盖,但能为大家提供一个框架性认识。</p>
<p><img src="https://images.bigseek.com//forum/202506/11/132235bdu0o20rll2ju17l.png" alt="下载.png" title="下载.png" /></p>
<p>梳理知识点和术语名词如下:</p>
<h3>一、核心技术体系</h3>
<ol>
<li>
<p>机器学习(ML:Machine Learning)通过数据训练模型实现预测或决策,包含监督学习、无监督学习和半监督学习。</p>
<ul>
<li><strong>监督学习</strong>:用标注数据训练分类或回归模型(如邮件过滤、房价预测)。</li>
<li><strong>无监督学习</strong>:挖掘数据隐含模式,生成监督信号(如聚类、降维、对比学习)。</li>
<li><strong>元学习(Meta-Learning)</strong>:让模型快速适应新任务,学会“如何学习”。</li>
<li><strong>联邦学习(Federated Learning)</strong>:保护隐私的分布式训练方式。</li>
<li><strong>在线学习(Online Learning)</strong>:模型随动态数据实时更新。</li>
</ul>
</li>
<li>
<p>深度学习(DL:Deep Learning)基于多层神经网络,突破传统机器学习限制。</p>
<ul>
<li><strong>Transformer</strong>:自注意力机制驱动的长文本处理架构(如GPT、BERT)。</li>
<li><strong>扩散模型(Diffusion Model)</strong>:逐步去噪生成高质量内容(如Stable Diffusion)。</li>
<li><strong>MoE(Mixture of Experts)</strong>:整合子模型提升性能(如Switch Transformer)。</li>
<li><strong>SNN(脉冲神经网络)</strong>:模拟生物神经脉冲时序。</li>
<li><strong>胶囊网络(Capsule Network)</strong>:捕捉空间层次关系。<br />
深度学习需大量数据和 GPU/TPU 算力支持。</li>
</ul>
</li>
<li>
<p>自然语言处理(NLP)让机器理解和生成人类语言的技术。</p>
<ul>
<li><strong>大语言模型(LLM)</strong>:超大规模预训练模型(如GPT-4、PaLM)。</li>
<li><strong>思维链(Chain-of-Thought)</strong>:分步推理提升逻辑能力。</li>
<li><strong>检索增强生成(RAG)</strong>:结合知识库提高答案准确性(如腾讯ima)。</li>
<li><strong>指令微调(Instruction Tuning)</strong>:通过指令优化模型行为。</li>
<li><strong>多模态对齐(Multimodal Alignment)</strong>:统一文本、图像等语义。</li>
</ul>
</li>
<li>
<p>计算机视觉(CV)从图像或视频提取信息的技术。</p>
<ul>
<li><strong>ViT(Vision Transformer)</strong>:Transformer 用于图像分类。</li>
<li><strong>NeRF(神经辐射场)</strong>:3D 场景重建与渲染。</li>
<li><strong>目标跟踪(Object Tracking)</strong>:视频中持续锁定目标(如SiamFC)。</li>
<li><strong>光流估计(Optical Flow)</strong>:计算像素运动轨迹。</li>
<li><strong>事件相机(Event Camera)</strong>:动态视觉低延迟感知。核心任务:</li>
<li><strong>目标检测</strong>:YOLO 实现实时物体定位。</li>
<li><strong>图像分割</strong>:U-Net 划分医学影像病灶。</li>
<li><strong>人脸识别</strong>:FaceNet 通过特征向量验证身份。</li>
</ul>
</li>
<li>
<p><strong>强化学习(RL)</strong></p>
<ul>
<li><strong>PPO(近端策略优化)</strong>:稳定策略梯度算法。</li>
<li><strong>模仿学习(Imitation Learning)</strong>:从专家行为学习策略。</li>
<li><strong>多智能体强化学习(MARL)</strong>:多智能体协作或竞争(如星际争霸AI)。</li>
<li><strong>逆强化学习(Inverse RL)</strong>:从行为推导奖励函数。</li>
</ul>
</li>
<li>
<p><strong>模型优化技术</strong></p>
<ul>
<li><strong>知识蒸馏(Knowledge Distillation)</strong>:压缩大模型(如DistilBERT)。</li>
<li><strong>量化感知训练(QAT)</strong>:模拟低精度计算。</li>
<li><strong>动态网络(Dynamic Networks)</strong>:动态调整模型结构(如SkipNet)。</li>
<li><strong>稀疏训练(Sparse Training)</strong>:剪除冗余连接。</li>
</ul>
</li>
</ol>
<h3>二、支撑技术生态</h3>
<ol>
<li>
<p><strong>算力基础设施</strong></p>
<ul>
<li><strong>芯片技术</strong>:
<ul>
<li><strong>GPU</strong>:NVIDIA A100/H100 加速深度学习。</li>
<li><strong>TPU</strong>:谷歌优化 TensorFlow 的 AI 芯片。</li>
<li><strong>类脑芯片</strong>:清华大学天机芯模拟神经计算。</li>
</ul>
</li>
<li><strong>云计算</strong>:AWS、阿里云提供弹性算力。</li>
</ul>
</li>
<li>
<p><strong>数据工程</strong>聚焦数据存储、清洗、标注和结构化。</p>
<ul>
<li><strong>数据标注</strong>:人工标注为主,涉及属性、框选、描点。</li>
<li><strong>数据增强</strong>:通过旋转、裁剪、加噪增强泛化能力。</li>
<li><strong>关键技术</strong>:
<ul>
<li><strong>数据版本控制(DVC)</strong>:类似 Git 管理数据集和模型。</li>
<li><strong>自动化特征工程(FeatureTools)</strong>:自动提取时间、聚合、关系特征。</li>
</ul>
</li>
</ul>
</li>
<li>
<p><strong>知识图谱</strong></p>
<ul>
<li><strong>图结构存储</strong>:以实体、关系、属性存储复杂数据。</li>
<li><strong>高效查询</strong>:支持图遍历查询(如最短路径、社区发现)。</li>
<li><strong>语义推理</strong>:挖掘隐含关系(如“A与B同事,B是C上司 → A与C可能相关”)。</li>
<li><strong>工具</strong>:Neo4j、Amazon Neptune。</li>
</ul>
</li>
</ol>
<h3>三、系统与架构</h3>
<ol>
<li>
<p><strong>模型协作与协议</strong></p>
<ul>
<li><strong>MCP(模型上下文协议)</strong>:标准化模型与工具/数据交互接口,解决碎片化。</li>
<li><strong>模型编排(Model Orchestration)</strong>:动态调度多模型完成任务。</li>
<li><strong>服务网格(Service Mesh)</strong>:管理微服务化模型通信。</li>
</ul>
</li>
<li>
<p><strong>分布式系统</strong></p>
<ul>
<li><strong>参数服务器(Parameter Server)</strong>:支持大规模分布式训练。</li>
<li><strong>All-Reduce 算法</strong>:梯度同步协议(如 Ring All-Reduce)。</li>
<li><strong>异构计算</strong>:CPU/GPU/TPU 协同优化。</li>
</ul>
</li>
</ol>
<h3>四、AI 应用技术</h3>
<ol>
<li>
<p><strong>行业应用</strong></p>
<ul>
<li><strong>生成式 AI(AIGC)</strong>:
<ul>
<li><strong>文本生成</strong>:ChatGPT、Claude 支持对话和文案。</li>
<li><strong>图像生成</strong>:Stable Diffusion、Midjourney 生成图像。</li>
<li><strong>视频生成</strong>:Sora 基于时空建模生成视频。</li>
</ul>
</li>
<li><strong>数字孪生(Digital Twin)</strong>:物理实体实时虚拟映射。</li>
<li><strong>AI for Science</strong>:助力科学发现(如 AlphaFold)。</li>
<li><strong>AIOps</strong>:智能运维(异常检测、根因分析)。</li>
</ul>
</li>
<li>
<p><strong>智能体与交互系统</strong></p>
<ul>
<li><strong>Agent(智能体)</strong>:具备自主感知-决策-行动能力(如自动驾驶、游戏 NPC)。</li>
<li><strong>具身智能(Embodied AI)</strong>:机器人智能(如波士顿动力)。</li>
<li><strong>多模态交互</strong>:融合语音、手势、眼动交互。</li>
<li><strong>典型应用</strong>:自动驾驶(激光雷达+摄像头+地图)。</li>
</ul>
</li>
<li>
<p><strong>边缘与终端 AI</strong></p>
<ul>
<li><strong>边缘智能</strong>:在手机、IoT 设备部署轻量模型。</li>
<li><strong>TinyML</strong>:低功耗微控制器机器学习。</li>
<li><strong>模型剪枝(Pruning)</strong>:优化模型适配边缘设备。</li>
<li><strong>神经形态计算(Neuromorphic Computing)</strong>:类脑芯片高效推理(如 Loihi)。</li>
<li><strong>典型应用</strong>:安防摄像头行为识别、传感器故障预测。</li>
</ul>
</li>
</ol>
<h3>五、未来发展方向</h3>
<ul>
<li>AGI(通用人工智能)指具备人类水平通用智能的系统,能跨领域学习、自主解决问题。
<ul>
<li><strong>核心特征</strong>:通用学习、抽象推理、目标导向、多模态感知、情感模拟。</li>
<li>AGI 是技术与哲学的交汇,脑科学、量子计算正推动其发展。</li>
</ul>
</li>
</ul>
<h3>六、伦理与安全</h3>
<ol>
<li>
<p><strong>技术隐私计算</strong>实现数据“可用不可见”。</p>
<ul>
<li><strong>联邦学习</strong>:本地保留数据,仅上传参数(如医院、银行联合训练)。</li>
<li><strong>同态加密</strong>:加密数据直接计算(如医疗风险评分)。</li>
<li><strong>差分隐私</strong>:添加噪声保护个体隐私(如统计数据)。</li>
</ul>
</li>
<li>
<p>AI 对齐(Alignment)确保 AI 行为符合人类价值观。</p>
<ul>
<li><strong>价值对齐</strong>:将公平、正义转为奖励函数。
<ul>
<li><strong>逆强化学习(IRL)</strong>:从人类行为推导规则(如安全驾驶)。</li>
<li><strong>人类反馈强化学习(RLHF)</strong>:优化 AI 输出(如 ChatGPT)。</li>
</ul>
</li>
<li><strong>可解释性</strong>:
<ul>
<li><strong>LIME</strong>:局部解释模型决策(如医疗影像分析)。</li>
<li><strong>SHAP</strong>:量化特征贡献(如金融风控)。</li>
</ul>
</li>
</ul>
</li>
<li>
<p><strong>内容安全与过滤</strong></p>
<ul>
<li><strong>规则过滤</strong>:关键词、正则表达式匹配。</li>
<li><strong>深度学习模型</strong>:检测暴力、色情内容(如 Perspective API)。</li>
<li><strong>对抗训练</strong>:增强模型鲁棒性。</li>
</ul>
</li>
</ol>
资料很全,挺不错
页:
[1]