AI认知笔记 2026.03 - 暗涌层流

背景导读 这是一份个人的 AI 观察笔记与实操记录。设立这个专栏的初衷，是希望为大家提供一个了解 AI 前沿与应用程度的窗口，希望能给你带来一种“原来 AI 做到这个事情已经很容易了”的直观感受。文章分为大众日常使用、办公效率重塑以及个人前瞻洞察三个部分，大家可以按需查阅。

第一章：大众视角的开箱即用#

1. 极简开箱：如何获取你的 AI 助手#

网页端体验（推荐首选）： 大多数平台登录都非常便捷。国内推荐使用 DeepSeek (deepseek.com)、豆包 (doubao.com)、千问 (qianwen.com)，以及 Kimi、MiniMax。国外平台可选择 ChatGPT、Claude 或 Gemini（gemini.google.com，需注意网络环境限制）。
手机 App 端： 直接在应用商店下载 DeepSeek、豆包或千问即可。
关于一些新奇的“端侧”或隐蔽功能（比如龙虾🦞？）： 建议普通大众不要去盲目折腾。最聪明的做法是等微信等常用App原生态接入且稳定后再去体验。

2. 这些 AI 到底能帮你做什么？#

解答生活百科： 直接复制粘贴你遇到的问题。如果不知道怎么问，千问内置了「指令中心」提供参考。比如你可以问“雷笋如何存储”，或者直接把体检报告丢给 AI 帮你做通俗解析。
超长文档问答： 把冗长复杂的文档直接发给 AI，然后再针对材料提问，迅速提取核心信息。
图像与视频生成： 可以根据一段文字描述生成图片，也可以基于你的原图进行 P 图修改。视频方面，目前豆包的 SeedDance 2.0 效果极佳，虽然日常极少用到，但值得了解。
快速制作 PPT： 当前上述 AI 主要适合做快速的 PPT 内容大纲展示；如果需要带模板的排版，可以尝试 Kimi；如果不需要后续编辑，Gemini 的 NotebookLM 中的 Slide Deck 功能是不错的选择。
沉浸式翻译： 豆包支持 PDF 导入后，进行高效的左右分屏对照翻译。
处理复杂任务： 开启豆包的「超能模式」或千问的「任务助理」。这部分功能耗时较长，AI 会在后台不断进行自我修正和答案完善。
开展深度研究： 豆包的「深入研究」、千问的「深度研究」以及 Gemini 的「Deep research」，能针对一个特定方向做极为详尽的分析，并直接交付整理好的素材。

3. 高效使用小技巧#

模型切换： 遇到具备一定专业性的问题时，建议在网页端手动将模型切换为【专家】、【深度思考】或【Pro】模式，输出质量会有质的飞跃。
分散提问： 敏感或私人的问题可以分散在不同厂商的 AI 里提问，防止个人数字画像被单一厂商过度记录。
横向对比： 哪家最好用？日常简单的使用其实区别不大，遇到复杂问题时，不妨把同一个问题发给多个 AI，感受一下各自的逻辑差异。
思维转变： 遇到平时觉得耗时、折腾的搜索与整理工作，第一反应应该是：“能不能先让 AI 试试？”

第二章：面向效率人群的实践#

1. 打造个人的 AI 知识库#

当你习惯了使用 AI，如何保存它的输出（通常为 Markdown 格式）就成了关键。推荐以下几款笔记软件：

Typora： 个人目前在用。付费买断制，排版美观。
Obsidian： 本地笔记软件，支持双向链接，目前的 AI 插件生态潜力非常不错。
Notion： 在线笔记领域的标杆，文档分享极其便捷。
VSCode + Markdown 插件： 程序员群体的最优解。

2. 深入研究与会议提效#

重度课题研究： 强烈推荐 Google Notebook（notebooklm.google）。你可以把一个方向的所有材料全部丢进去，它支持 Slide 和海报导出，目前网上常见的“一图流”很多都是用它生成的。
解放会议记录： 多关注你们公司当前使用的通讯协作工具，目前的“智能会议纪要”功能已经非常成熟，足以替代人工记录。

3. 生产力 Agent（智能体）工具盘点#

最强梯队（均需付费）： Claude Code (Anthropic) 与 CodeX (OpenAI)。注：Claude Code 容易封号，需要通过设置绕开登录或接入中转 API 使用；Google Antigravity 因登录体验不佳，暂不推荐。
平替梯队（当前免费）： OpenCode（开源，有免费模型，支持接入海量模型与 VSCode 插件）、TRAE（字节跳动出品，知名度较高，推荐尝试）、Lingma（阿里出品）。

4. Agent 究竟能用来做什么？#

只要 Token 足够，当前 Agent 几乎可以胜任任何脑力劳动任务。目前实践体验较好的场景包括：

整理复杂文档： CodeX 实测表现优异。建议学习一下“Skill”的用法，上述 Agent 都具备 skill-create 能力，能让你非常方便地创建专属技能。
辅助代码编写： 上述软件均可胜任小型项目；如果是大型项目，则需要引入开发范式（Skill / MCP）来进行宏观控制。
构建自动化工作流： 将你日常繁琐的固定流程编写为 Skill，即可实现一键启动、全自动执行。

第三章：前瞻信息与个人洞察#

这一部分记录了当前我个人对 AI 行业发展的部分观察与思考。认知随时间迭代，后续可能会有修正。

裁员潮会开始吗？ 会开始的。当前各行业大多处于观望状态，一旦有头部公司跑通了 AI 降本增效的成功案例，裁员动作就会大面积铺开。当前 AI 已经具备了完全替代初级工作的能力，团队的“精英化”与“少人化”是必然趋势，只是时间早晚的问题。

Agent将如何演进？ OpenClaw 爆火的最大意义，在于它让用户“顺滑”地接受了 Agent 的交互模式。原本占据互联网生态位的大厂，会逐渐将传统的 App 升级为 Agent 形态（例如今年千问推出的点外卖服务，背后就是 Agent 技术）。对大众而言，“只要开口对话就能解决问题”将成为全新的操作习惯。

科研的边界在哪里？ 最近有一项耗时 9 天的自动化科研工作引发了轰动，它完成了从想法到实验再到 100 篇论文输出的全链路。像 Karpathy 的 autoresearch 已经可以高效迭代优化任务。随着 Token 价格的持续走低和底层流程的开放，科研效率将实现指数级飞跃。在未来，“定义问题”的能力将远比“解答问题”更重要，科研的核心将转向如何不断扩展人类问题的边界。

软件开发会被颠覆吗？ AI 辅助开发会让代码生成变得极快且高度可控。未来的程序员，或者说“产品负责人”（少人全包制将成为常态），需要将绝大部分精力从敲击代码转移到“基于市场需求规划软件演进路线”上。

大模型开源生态会走向何方？ 我个人对当前的开源生态持悲观态度。随着阿里对大模型的定位向商业变现倾斜，Qwen 系列未来可能会走向闭源；最近的 MiniMax M2.7 也已经转为闭源模型。目前虽然还有智谱、Kimi、DeepSeek 在坚持，但这些大厂为了商业模式，最终必然会走向 ToB（云供应商）的合作方向。在当前的格局下，或许只能指望DeepSeek是否能在“小模型”研究上带来新的开源生机。

算力与模型如何共生？ 两者将更加紧密地咬合。NVIDIA 目前正朝着算力层绝对巨头的方向狂奔，但从长期来看，模型架构与底层芯片的“系统级融合”，才是进一步压低 Token 成本的终极关键点。

教育的本质将发生什么改变？ 随着普通脑力劳动的严重贬值，传统以死记硬背和机械运算为主导的教育模式将被彻底颠覆。因为未来依然需要人类去“指挥和管制” AI，所以人依然需要学习。但学习的重心将彻底转向对“核心概念与底层理论”的掌握，并结合 AI 提供的高速实践反馈来试错。这与目前的应试教育形式有着天壤之别。

面对这一切，我们该关注什么？ 首先，关注你的身心健康。其次，去拥抱这项新技术，拥抱这个已经到来的时代。

写于2026-03-22，通过Gemini润色