2305 字
12 分钟
AI认知笔记 2026.03
2026-03-22

背景导读 这是一份个人的 AI 观察笔记与实操记录。设立这个专栏的初衷,是希望为大家提供一个了解 AI 前沿与应用程度的窗口,希望能给你带来一种“原来 AI 做到这个事情已经很容易了”的直观感受。文章分为大众日常使用、办公效率重塑以及个人前瞻洞察三个部分,大家可以按需查阅。


第一章:大众视角的开箱即用#

1. 极简开箱:如何获取你的 AI 助手#

  • 网页端体验(推荐首选): 大多数平台登录都非常便捷。国内推荐使用 DeepSeek (deepseek.com)、豆包 (doubao.com)、千问 (qianwen.com),以及 KimiMiniMax。国外平台可选择 ChatGPTClaudeGemini(gemini.google.com,需注意网络环境限制)。
  • 手机 App 端: 直接在应用商店下载 DeepSeek、豆包或千问即可。
  • 关于一些新奇的“端侧”或隐蔽功能(比如龙虾🦞?): 建议普通大众不要去盲目折腾。最聪明的做法是等微信等常用App原生态接入且稳定后再去体验。

2. 这些 AI 到底能帮你做什么?#

  • 解答生活百科: 直接复制粘贴你遇到的问题。如果不知道怎么问,千问内置了「指令中心」提供参考。比如你可以问“雷笋如何存储”,或者直接把体检报告丢给 AI 帮你做通俗解析。
  • 超长文档问答: 把冗长复杂的文档直接发给 AI,然后再针对材料提问,迅速提取核心信息。
  • 图像与视频生成: 可以根据一段文字描述生成图片,也可以基于你的原图进行 P 图修改。视频方面,目前豆包的 SeedDance 2.0 效果极佳,虽然日常极少用到,但值得了解。
  • 快速制作 PPT: 当前上述 AI 主要适合做快速的 PPT 内容大纲展示;如果需要带模板的排版,可以尝试 Kimi;如果不需要后续编辑,Gemini 的 NotebookLM 中的 Slide Deck 功能是不错的选择。
  • 沉浸式翻译: 豆包支持 PDF 导入后,进行高效的左右分屏对照翻译。
  • 处理复杂任务: 开启豆包的「超能模式」或千问的「任务助理」。这部分功能耗时较长,AI 会在后台不断进行自我修正和答案完善。
  • 开展深度研究: 豆包的「深入研究」、千问的「深度研究」以及 Gemini 的「Deep research」,能针对一个特定方向做极为详尽的分析,并直接交付整理好的素材。

3. 高效使用小技巧#

  • 模型切换: 遇到具备一定专业性的问题时,建议在网页端手动将模型切换为【专家】、【深度思考】或【Pro】模式,输出质量会有质的飞跃。
  • 分散提问: 敏感或私人的问题可以分散在不同厂商的 AI 里提问,防止个人数字画像被单一厂商过度记录。
  • 横向对比: 哪家最好用?日常简单的使用其实区别不大,遇到复杂问题时,不妨把同一个问题发给多个 AI,感受一下各自的逻辑差异。
  • 思维转变: 遇到平时觉得耗时、折腾的搜索与整理工作,第一反应应该是:“能不能先让 AI 试试?”

第二章:面向效率人群的实践#

1. 打造个人的 AI 知识库#

当你习惯了使用 AI,如何保存它的输出(通常为 Markdown 格式)就成了关键。推荐以下几款笔记软件:

  • Typora: 个人目前在用。付费买断制,排版美观。
  • Obsidian: 本地笔记软件,支持双向链接,目前的 AI 插件生态潜力非常不错。
  • Notion: 在线笔记领域的标杆,文档分享极其便捷。
  • VSCode + Markdown 插件: 程序员群体的最优解。

2. 深入研究与会议提效#

  • 重度课题研究: 强烈推荐 Google Notebook(notebooklm.google)。你可以把一个方向的所有材料全部丢进去,它支持 Slide 和海报导出,目前网上常见的“一图流”很多都是用它生成的。
  • 解放会议记录: 多关注你们公司当前使用的通讯协作工具,目前的“智能会议纪要”功能已经非常成熟,足以替代人工记录。

3. 生产力 Agent(智能体)工具盘点#

  • 最强梯队(均需付费): Claude Code (Anthropic) 与 CodeX (OpenAI)。注:Claude Code 容易封号,需要通过设置绕开登录或接入中转 API 使用;Google Antigravity 因登录体验不佳,暂不推荐。
  • 平替梯队(当前免费): OpenCode(开源,有免费模型,支持接入海量模型与 VSCode 插件)、TRAE(字节跳动出品,知名度较高,推荐尝试)、Lingma(阿里出品)。

4. Agent 究竟能用来做什么?#

只要 Token 足够,当前 Agent 几乎可以胜任任何脑力劳动任务。目前实践体验较好的场景包括:

  • 整理复杂文档: CodeX 实测表现优异。建议学习一下“Skill”的用法,上述 Agent 都具备 skill-create 能力,能让你非常方便地创建专属技能。
  • 辅助代码编写: 上述软件均可胜任小型项目;如果是大型项目,则需要引入开发范式(Skill / MCP)来进行宏观控制。
  • 构建自动化工作流: 将你日常繁琐的固定流程编写为 Skill,即可实现一键启动、全自动执行。

第三章:前瞻信息与个人洞察#

这一部分记录了当前我个人对 AI 行业发展的部分观察与思考。认知随时间迭代,后续可能会有修正。

裁员潮会开始吗? 会开始的。当前各行业大多处于观望状态,一旦有头部公司跑通了 AI 降本增效的成功案例,裁员动作就会大面积铺开。当前 AI 已经具备了完全替代初级工作的能力,团队的“精英化”与“少人化”是必然趋势,只是时间早晚的问题。

Agent将如何演进? OpenClaw 爆火的最大意义,在于它让用户“顺滑”地接受了 Agent 的交互模式。原本占据互联网生态位的大厂,会逐渐将传统的 App 升级为 Agent 形态(例如今年千问推出的点外卖服务,背后就是 Agent 技术)。对大众而言,“只要开口对话就能解决问题”将成为全新的操作习惯。

科研的边界在哪里? 最近有一项耗时 9 天的自动化科研工作引发了轰动,它完成了从想法到实验再到 100 篇论文输出的全链路。像 Karpathy 的 autoresearch 已经可以高效迭代优化任务。随着 Token 价格的持续走低和底层流程的开放,科研效率将实现指数级飞跃。在未来,“定义问题”的能力将远比“解答问题”更重要,科研的核心将转向如何不断扩展人类问题的边界。

软件开发会被颠覆吗? AI 辅助开发会让代码生成变得极快且高度可控。未来的程序员,或者说“产品负责人”(少人全包制将成为常态),需要将绝大部分精力从敲击代码转移到“基于市场需求规划软件演进路线”上。

大模型开源生态会走向何方? 我个人对当前的开源生态持悲观态度。随着阿里对大模型的定位向商业变现倾斜,Qwen 系列未来可能会走向闭源;最近的 MiniMax M2.7 也已经转为闭源模型。目前虽然还有智谱、Kimi、DeepSeek 在坚持,但这些大厂为了商业模式,最终必然会走向 ToB(云供应商)的合作方向。在当前的格局下,或许只能指望DeepSeek是否能在“小模型”研究上带来新的开源生机。

算力与模型如何共生? 两者将更加紧密地咬合。NVIDIA 目前正朝着算力层绝对巨头的方向狂奔,但从长期来看,模型架构与底层芯片的“系统级融合”,才是进一步压低 Token 成本的终极关键点。

教育的本质将发生什么改变? 随着普通脑力劳动的严重贬值,传统以死记硬背和机械运算为主导的教育模式将被彻底颠覆。因为未来依然需要人类去“指挥和管制” AI,所以人依然需要学习。但学习的重心将彻底转向对“核心概念与底层理论”的掌握,并结合 AI 提供的高速实践反馈来试错。这与目前的应试教育形式有着天壤之别。

面对这一切,我们该关注什么? 首先,关注你的身心健康。其次,去拥抱这项新技术,拥抱这个已经到来的时代。

写于2026-03-22,通过Gemini润色

AI认知笔记 2026.03
http://y-ume.github.io/posts/ainote2603/
作者
暗涌层流
发布于
2026-03-22
许可协议
CC BY-NC-SA 4.0