202601

links

从函数逼近论视角看神经网络与深度学习:本质、演进及数学联系[原]
https://mp.weixin.qq.com/s/ogbVEAerR6youA2cMeGlMw

万字解析 Manus 的 PMF 和 AI Agent 赛道竞争的稳态约束
https://mp.weixin.qq.com/s/bS1uAqBlAC4rOURqfWXPvQ

我的AI研究这十一年:从零论文到英伟达
https://mp.weixin.qq.com/s/Z3VtgQ7fhAU30gt4enGoBg

单词转音标

  • https://github.com/repp/big-phoney

  • https://github.com/hans00/phonemize

  • https://github.com/cocojojo5213/phonics-app.git

  • https://github.com/techczech/phonicsengine

    from g2p_en import G2p
    g2p = G2p()
    g2p(“example”)
    [‘IH0’, ‘G’, ‘Z’, ‘AE1’, ‘M’, ‘P’, ‘AH0’, ‘L’]

    import eng_to_ipa as ipa
    ipa.convert(“example”)
    ‘ɪgˈzæmpəl’
    ipa.convert(“examples”)
    ‘ɪgˈzæmpəlz’
    ipa.convert("The software industry sits at a strange inflection point. ")
    ‘ðə ˈsɔfˌwɛr ˈɪndəstri sɪts æt ə streɪnʤ ˌɪnˈflɛkʃən pɔɪnt.’

    npm install phonemize
    cat test.mjs
    import { phonemize, toIPA, toARPABET } from ‘phonemize’

    console.log(phonemize(‘Hello world!’))
    console.log(toARPABET(‘Hello world!’))

    import { Tokenizer, createTokenizer } from ‘phonemize’

    const tokenizer = createTokenizer({
    format: ‘ipa’,
    stripStress: true,
    separator: ‘-’
    })

    const tokens = tokenizer.tokenizeToTokens(‘Hello world!’)
    console.log(tokens)

mac os 本地 https 反向代理

sudo vi /etc/hosts
127.0.0.1 tools.myapp1024.com

brew install mkcert
brew install nss   # 很重要,给 Firefox / 微信 WebView 用

mkcert -install
mkdir -p ~/certs
cd ~/certs

mkcert tools.myapp1024.com

vi /opt/homebrew/etc/nginx/nginx.conf

server {
    listen 443 ssl;
    server_name tools.myapp1024.com;

    ssl_certificate     /Users/你的用户名/certs/tools.myapp1024.com.pem;
    ssl_certificate_key /Users/你的用户名/certs/tools.myapp1024.com-key.pem;

    ssl_protocols TLSv1.2 TLSv1.3;

    location / {
        proxy_pass http://localhost:3000;

        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto https;
    }
}

sudo nginx
sudo nginx -s reload

agent

  • Agent 不是单次调用的模型能力,而是一个由模型、工具、文件系统与验证机制构成的系统。真正有效的 agent 不是“更会答题”,而是“能在工程里持续交付结果”。
  • Agent loop 的三步循环决定上限:Gather Context / Take Action / Verify Work
    • 许多 agent 的失败不是因为模型不强,而是缺少可靠的上下文收集与验证机制。验证越强,agent 就越能承担复杂任务;验证越弱,越只能停留在演示级别。
  • 行动方式不是“工具至上”,而是 Tools / Bash / Codegen 的组合权衡
    • Tools 结构化、可控、低风险,但上下文成本高、可组合性差
    • Bash 组合能力强、上下文更省,但需要发现成本
    • Codegen 最灵活,但执行成本最高、风险最大
    • 很多团队过度依赖 Tools,而低估了 Bash 的价值。
  • Skills 不是“塞进 prompt 的资料包”,而是按需加载的专业流程;
  • 文件系统本身可以充当 memory,让 agent 在长任务中保持可复查、可迭代的状态。
  • 你完全可以用 agent SDK 来做 workflow。
  • 你可以在 gather context 和 take action 之间插入 planning 步骤,让 agent 逐步思考
  • 每次 tool call 我们都会建议把结果存入文件,并让 tool 返回文件路径,这样便于后续搜索、复查与验证。
  • 我会把所有 CLI 脚本设计成带有 --help 或类似子命令的形式,这样模型可以调用它并逐步发现脚本的子命令。
  • 在 claude agent SDK 里,我会建议你直接用文件系统,比如建一个 memories 文件夹,让 agent 把记忆写到那里。
  • 验证应该尽可能到处进行,而不是只放在最后。
    • 如果在中间有规则或启发式检查,可以在早期就抛错并给出反馈,模型会读取错误输出并作出相应调整。

大学里的计算机课程通常专注于讲授从操作系统到机器学习这些学院派的课程或主题,而对于如何精通工具这一主题则往往会留给学生自行探索。在这个系列课程中,我们讲授命令行、强大的文本编辑器的使用、使用版本控制系统提供的多种特性等等。学生在他们受教育阶段就会和这些工具朝夕相处(在他们的职业生涯中更是这样)。

https://missing-semester-cn.github.io/