Shemol's Blog

Claude Code の Memory 管理

2026-02-27T00:00:00.000Z

Claude Code の Memory 管理

新しい小シリーズ、エージェントの memory。まずは CC（Claude Code）のネイティブ memory 管理から。

CC ネイティブの memory 管理：

読んだ印象としては、面接で「こういうシステムを組みました」と言っても、絶対に通らないだろうな、という感じだった。

CC のネイティブ memory 管理はファイルシステム経由。

セッションをまたいで永続化される記憶には次の 2 種類がある。

Auto memory：Claude が有用な文脈（プロジェクトのパターン、重要なコマンド、ユーザーの好みなど）を自動保存する。セッション間で保持される。

CLAUDE.md ファイル：自分で書き・保守する Markdown。Claude に従わせる指示・ルール・好みを書く。

どちらも各セッション開始時に Claude のコンテキストに読み込まれるが、自動記憶はメインファイルの先頭 200 行だけが読み込まれる。

切り捨てはあまり良い方法ではない気がする…

CC の memory の階層構造：

組織スコープ（組織の全ユーザー向け）

Managed policy：IT / DevOps が管理する組織全体の指示。コーディング規約、セキュリティ方針、コンプライアンスなど。

チーム・プロジェクトスコープ（そのプロジェクトの全メンバー向け）

Project memory：チーム共有のプロジェクト指示。アーキテクチャ、コーディング標準、よくあるワークフローなど。

Project rules：モジュール化されたトピック別のプロジェクト指示。言語別ガイド、テスト規約、API 標準など。

個人スコープ（個人向け）

Project memory：個人のプロジェクト固有の好み。サンドボックス URL、優先するテストデータなど。

Auto memory：プロジェクトのパターン、デバッグの気づき、アーキメモなど。

Auto memory には次のようなものが含まれる。

プロジェクトのパターン：ビルドコマンド、テストの慣習、コードスタイルの好み

デバッグの洞察：厄介な問題の解き方、よくあるエラーの原因

アーキテクチャのメモ：重要なファイル、モジュール関係、重要な抽象概念

個人の好み：コミュニケーションスタイル、ワークフロー、ツール選び

これらの保存場所の詳細はドキュメントを参照。

前述のとおり MEMORY.md は先頭 200 行だけ読み込まれる。また Claude Code は簡潔に書くよう指示されており、詳しいトピックは別ファイルに移す。

オンデマンド読み込み：debugging.md や patterns.md のようなトピックファイルは起動時には読み込まれない。必要なときに標準のファイルツールで読む。

Claude はセッション中に memory ファイルを読み書きするので、作業しながら memory が更新されるのを見られる。

Claude Code は memory を再帰的に読む：カレントワーキングディレクトリから上に向かってルート / まで（ただし / 自体は含めない）辿り、見つかった CLAUDE.md や CLAUDE.local.md を読む。大きなコードベースで便利。例：foo/bar/ で Claude Code を動かしていて、foo/CLAUDE.md と foo/bar/CLAUDE.md の両方がある場合。

またカレント以下のサブツリー内の CLAUDE.md も見つける。これらは起動時には読み込まれず、Claude がそのサブツリー内のファイルを読むときに初めて取り込まれる。

他ディレクトリからの memory 読み込みや編集、モジュール化ルールなどもあるが、ここでは省略。

他言語

中文

English

陳皓（耗子）氏と「3.25」——知恵袋の記録（転載）

2026-02-17T00:00:00.000Z

陳皓（耗子）氏と「3.25」——知恵袋の記録（転載）

ノート整理のときに見つけ、ブログに残しておきたかった。

作者：匿名ユーザー

リンク：https://www.zhihu.com/question/29614511/answer/45025842

出典：知乎

著作権は作者に帰属。商用転載は作者の許可が必要。非商用転載は出典明記のうえで。

匿名にしなければならない。利害関係者で、耗子（陳皓）氏のチームメンバーと近く付き合っており、いくつか知っている。

事情はこうだったと思う。当時アリババクラウドの ECS で VPC というプロジェクトがあり、一年ほどやっているのにまだ正式リリースになっていなかった。最初から方向を誤ったらしい。友人の話では、最初から耗子は ECS 側の技術案が間違っていると争ったが、プロジェクトが大きすぎ、三十〜四十人・複数チームだったという。耗子一人ではコントロールできず、友人の言葉を借りれば「アリババには神様が多すぎた」。

このプロジェクトは初日から非人道的な残業で、月曜から日曜まで、毎日深夜二〜三時まで、三〜四か月続いた。そんな残業が信じられるか。

友人もこのプロジェクトにいて、毎日のように技術的な問題を愚痴っていた。相当おかしいものもあり、まったくの素人が犯すようなミスだった。

耗子はプロジェクトをコントロールできないので、自チームには残業をさせなかった。低レベルなミスは残業が原因だと考え、彼が残業反対で知られていたからだ。友人の話では、当時チームに半分冗談でこう言ったという。残業が八時を過ぎたら評価 3.25、価値観 C だ、と。（KPI のために命を削る連中を皮肉ったのだと思う。）

結局プロジェクトは失敗し、今も大規模なやり直し中だという。当時三か月やってバグだらけで本番に上げられず、上層部が動いたらしい。そこで責任追及があり、プロジェクト責任者が上のボスに「一部は耗子のチームが力不足で、残業してくれなかったからだ」と言った。翌日、ボスは友人と耗子チームの他のメンバーを、毎日深夜まで残るチームに異動させようとした。一日かけて話したが、誰一人行きたがらなかった。

実際には？耗子チームの二人は残業なしで自モジュールを期限どおり終え、発生バグの数もごく一部にすぎなかった。

それでもボスは強引に決めた。人は移さなくてよいが、仕事の割り当ては向こう側が行い、耗子は完全に空権となった。耗子のチームは事実上なくなった。

この二日、耗子が微博で「寒波」について論理破綻だらけの広報文を批判したあと、会社の広報部が動き、新しい上司は耗子のチームを直接引き剥がした。友人も含めチーム全体、耗子本人も知らなかった。ここを見ると、アリババのマネジメントは暴力的だろう。

これが耗子が微博で書いていた、「価値観」の違いによる迫害の一例なのだろう。

他言語版

中文

English

2026.1.31

2026-01-31T00:00:00.000Z

2026.1.31

水曜に研究室の忘年会が終わって正式に休みに入ってから書こうと思っていたが、延びに延びて、論文を投げ終わってからにしようと思い、今日ようやく寮の片付けが終わって時間ができた。

実際、何を書けばいいのかもはっきりしない。忙しいようで何に忙しかったのかもよくわからない。これまで学んだことを軽くまとめ、これからの学習の計画にするくらいのつもりだ。

まず全体のトーンを決める。AI は能力の増幅器なら、学習にもっと時間をかけ、アイデアをより沈殿させる必要がある。なので当面の主戦場は学習、より細かく深い学習だ。インターンや就活のことも焦りはあるが、どうもそれほど重要ではない気もする。どれも外からの評価軸だ。インターンで一社に入り、将来また一社に入るのは、他人のプロダクトを作り、他人のアイデアを実現することになる。なら自分のプロダクトを試してみたらどうか。何でもいい、良くても悪くても。自分のものを持ってからインターンに行くのも、きっと役に立つ。

フルスタック（当面はフロントを）

最近フロントを学んでいて、TypeScript、React、実プロジェクトを触っている。アイデアはいくつかあるがまだ手をつけていない。やるとなると時間がかかる。進めながら知識を復習し、インターン対策で暗記も必要かもしれない。来学期の重点になりそうだ。最終目標はフルスタック。一歩ずつ。まず Web、次にアプリ、やがてバックエンドやデータベースへ。

Agent

Agent はまだ粗いと感じる。もっと掘り下げたい。博杰先生の講座や配信、LangChain などのフレームワーク、SDK、API も見る。hook や skills なども追い、新しい技術をフォローする。

多くの先輩が出している frontend skills なども含めて。

Memory

細分化すると memory だ。memory はかなり重要だと思う。以前はファイルシステムか RAG くらいに考えていたが、浅すぎた。インターンで白婷先生の memory に関するレビュー論文を読み、いろいろな memory プロダクトに触れて、そう単純ではないとわかった。まだ掘るべきことがある。

論文

1 月 29 日が ICML の締切で、ここ数日は先輩に連れられて論文を猛スピードで書いた。図表をたくさん描き、先輩に図の描き方、表の作り方、レイアウトと論文の書き方をたくさん教わった。先輩と徹夜もした。忘れられない。先輩の論文の組み立て方はこれからも咀嚼したい。来学期は卒業のためにまた論文が必要だろうが、いったん脇に置く。当面はそこまで優先度は高くない。関連することは memory から disk に移してよい。

インターン

論文締切の八時以降、インターン用の書類を印刷し、翌日（三十日、昨日）memory 系スタートアップで一日インターンした。仲間もよい人ばかりで、この日も多くを学んだ。memory プロダクトや、みんなが使っているツールも見せてもらった。ただ自分の事情で、来週からは行かないことにした。自分のことに集中する。サマーインターン、日常インターンもいったん保留し、まず自分のプロダクトを作る。

インターンも外の評価軸だ。日常インターンがどれほど大事か、サマーが本採用にどれほど効くか、みんな言うが、本質は自分に構築力・実戦力があるかどうかだ。他人の OSS にコントリビュートするのも、いったん止めて、自分のものを試したい。時間はない。創り始める。ポートフォリオを持って応募したい。AI がジュニアエンジニアを減らしている流れとも合うと思う。もちろん基礎は固めないと。

オープンであること

もっとオープンになり、多くの人と接するよう意識してきた。しばらく前は論文のことで先輩とやりとりしたり、一日だけのインターンの経験も、その考えを強めた。人と関わる機会を増やし、先入観で線を引かない。

接し方もいろいろ試している。Kubernetes release team の shadow に入りたいなら、今から準備を始める。

表現力も鍛えたい。音声入力の typeless や autotyper などをもっと使えば、吃音も少し直せるかもしれない。

運動

今朝はスクワットを少しした。できる範囲から運動を積み上げるのも大事だと思う。彼女はよく「男は二十五を過ぎたら六十五」と言う……先輩も運動の大切さを強調する。きちんと向き合う。

最後に

あとは特にない。ときどきまとめるのも悪くない。打つのは速いが、だいたい無駄話。

最近は Things で Todo とプロジェクト管理をしている。悪くない。習慣にしたい。Telegram には読んだ記事のリンクを溜めている。

あとで Agent memory プロダクトを整理するかもしれない。

2026.1.4 — Agent

2026-01-05T00:00:00.000Z

2026.1.4 — Agent

Cursor の公式サイトのページを真似しようとして挫折し、話題を Agent に戻した。

「AI プログラミング」のところで、大企業の日常開発の話がなかなかおかしい。コードを書いている時間が 15% しかない、というのは本当に好きになれない。

Research Code はエージェントやスクリプトを書くのに使える。

インフラ寄りのコード——Linux カーネルやコンセンサスプロトコルなど——は、どれもまだいまいち。

vibe coding のベストプラクティスは分割で、一度に生成するコードはできるだけ少なくする。

もう一つは TDD（テスト駆動開発）。正直こちらのほうが Ralph 開発より信頼できる気がする…

大規模リファクタでは spec が重要だ。spec に基づいて Linux カーネルのファイルシステムを書く、という論文もあるらしいが、効果はまだ分からない。

厳密な evaluation system も、コードデータを積み上げるプロセスだ。今は誰もがデータの重要性を知っていて、各社がデータセットを作っている。

シリコンバレー巨大企業の事情は本当に勉強になる。

スタートアップの示唆もかなり参考になる。実際、スタートアップは業界全体の中で自分のエコロジカル・ニッチを見つける必要がある。汎用領域は大手がやるので、かなり細かい垂直領域を取りに行く。

工程実践から離れてはいけない。自分の手で試して初めて、その仕事に対する一番リアルな感覚がつかめる。vibe coding でもモデル学習でも、噂話だけでなく自分で試すこと。

技術実践

Context Engineering の枠組み

System Prompt

Tools

Data Retrieval

Long Horizon Optimizations（長期タスクの最適化）

Data Retrieval のパラダイムシフト：新しいやり方は just in time（必要なときに） の読み込み。

戦略 1：軽量な識別子

漸進的開示（progressive disclosure）

自律的探索

すべてのモデルは長いコンテキストで性能が落ちる。

コンテキストウィンドウの容量を超えたときの対処：

コンテキスト圧縮

Agent が明示的な記憶アーティファクトを持ち、「作業メモ」として判断・学習・状態を保存する。必要なときに検索し、すべてをコンテキストに載せ続けない

Sub-Agent。複雑なタスクを専門の Agent に分割し、各 Sub-Agent は集中した、明確で狭いコンテキストを持つ。main agent がオーケストレーションし結果を統合する

Skills 機構の仕組み

Claude が動的に発見して読み込める。

``markdown


pdf/SKILL.md（メイン）
├── YAML Frontmatter (name, description)
├── Overview（概要）
└── References: "For advanced features, see /reference.md"
pdf/reference.md（詳細リファレンス）
└── Advanced PDF processing features...
pdf/forms.md（専用機能）
└── PDF form filling instructions...

Memory（記憶）

Sub Agents & Collaboration（サブ Agent と協調）

Dynamic Tool Calls（動的ツール呼び出し）

Code Generation & Execution（コード生成と実行）

Web Search（ウェブ検索）

Agentic Search（エージェント型検索）

Long Running Tasks（長時間タスク）

他言語

中文

English

year-review-2025-ja

2026-01-01T00:00:00.000Z

年末の振り返り——2025

また一年が終わった。12 月 31 日に書こうと思っていたが、昨日は午前と午後に面接が一つずつあり、そのあと彼女のところへ行き、彼女の家で食事をしてから友人たちと合流して年を越し、時間がなかった。今日ようやく座って書き始める。

fedi で 2025 年初めの自分の投稿を探し、時間を 2025 年 1 月に戻した。2024 年末はアニメや漫画をたくさん観た。カウボーイビバップ、EVA を再視聴、ファイアパンチ、チェンソーマンを再視聴、ルックバックを再視聴。2025 年初めも映画やアニメを続けた。

2025 年は自分の干支の年で、家族が法要で太歳を鎮めてくれ、お守りももらった。私は二週間もしないうちに完全に寮に置きっぱなしにした。一方でそういうものは信じないし、占いの先生のことも好きではなかった。2025 年全体を振り返っても、運命がもたらした思いがけない喜びや悲しみはあまり感じない。多くの出来事はよく観察すれば、その原因が辿れる。これからもよく観察する習慣を続け、引き続き connect the dots していきたい。

自分で手を動かしてやってみたが、いくつか失敗もあったははは。

いくつかの夢。

1 月に初めてコスプレに挑戦し、ルームメイトと一緒に行った。私は碇シンジ、彼は渚カヲル。一日中歩き回って疲れたが楽しかった。アスカに声をかけてもらった。

連絡を交わして、その方は安颯先生だと分かった。

17 日のイベントにも行った。ずっと前に買ったチケットで、行かないのは惜しいから。もう一つは、安颯先生にもう一度会いたかったから（笑）。

その後も QQ でやりとりし、学校に戻ってからも会う約束をした。

彼女の友人が占いで「2 月に必ず恋人ができる」と言われたという。私はその予言に乗っかり、2 月の最後の日に告白し、付き合うことになった。

『四畳半神話大系』の言葉どおり。「恋人たちがめでたく結ばれることほど、取るに足りないことはない。」

今年の生活は例年と大きく変わった。ほとんど生活も儀式もなく、二人の予定を立て、祝日の段取りを考え、いろいろな角度から物事を考える必要が出てきた。信頼の課題、成長の見方、親密な関係の扱い方など、たくさんの課題があった。急に十キロ痩せて、元より十キロ太った。親密な関係は二人のことだが、向き合っているのは結局いつも自分自身だと思う。

だから今年は、いろいろな面で成長した一年だった。

英語は少しは上達したが、まだ足りない…日本語は年初に少し触っただけで、その後は続けていない…

北京で shrik3 サイトの管理者さんに会い、食事をしながら二、三時間話した。とてもいいサイト管理者の方だった！お土産もありがとう！

4 月の考えはまだこうだったが、下半期はエージェントと合意プロトコルに没頭した…

では、自分はどうすべきか。

今年観たアニメは多くない。GQuuuuuuX は彼女とも好きな作品だった。夏休みは研究に没頭し、コスの時間もなかった。彼女が転職後、週末休みがない仕事になり、イベントにもあまり行けなくなった。

4 月頃の株の波動で、少しだけ利益が出た。その後から年末まで、株はおおむね穏やかに上がり続けた。バリュー投資を実践する身として、持ち続けるつもりだ。

不安になるとインターンに応募して水を試す癖がある。今年の年末も同じで、応募して中小三社から面接の機会をもらった。12 月最終日に二つ面接して、自分の課題がはっきりした。相変わらずアルゴリズムと面接で問われる定型的な基礎知識、プロジェクト経験もポジションに合わせる必要がある。面接前は緊張しても、面接官の前に出ると緊張が消える。面接のフローに入り、答えることだけに集中し、他は考えない。終わるとぐったりする。

おおむね上の計画は満たせた。論文の作業もほぼ進み、実験の仕上げと論文執筆が残る程度になった。負荷が下がったので、インターン準備も並行できる。

言い忘れていた。付き合ってから一緒にコスプレにも行った。一回目は彼女がレイ、私がトガタ（『ファイアパンチ』）。もう一回は EVA の朝阳大悦城イベント「潮流と芸術展」で、私が碇シンジ、彼女がアスカ。

自分にそんな才能があるのだろうか。

自分の夢はどこにある？

今でもこう問いたい。Aaron Swartz は今日の LLM を喜ぶだろうか。知識へのアクセスは楽になった一方、Rob Pike が言うように、オープンソースのコードが学習に使われて逆に技術独占を強めるのは、Aaron が望んだ姿ではないだろう。

5 月末から 6 月初旬に、指導教員が先輩二人と私を食事に連れて行ってくれた。一人は NUS で博士課程にいる。とても外向的な先輩で、食事中は行程から学術ゴシップまで話が尽きなかった。体力のピークでは徹夜のあとでも 1000m を 3 分半以内で走れたという。記憶力もよく、ゴシップの細部まで覚えている。私が学校近くで映画を観に行くと言うと、すぐに映画館の名前を二つ挙げた。印象に残ったのはこの二点と、自分との差を感じた二点。自分はそこまで体力がなく、記憶力も弱く、枠組みだけ残って細部は忘れがちだ。

先輩にも苦しい時期があった。話してくれる範囲は聞いたが、本人以外誰も触れられない部分もあるに違いない。

その食事から間もなく、先輩についてエージェントと合意プロトコル関連の研究を始め、最近ようやく筋道が見えてきた。年末の振り返りで研究内容を長々とは書かないが、今年は研究でも成果が出せればいい。

彼女とのやりとりのちょっとした笑い話。

vibe coding、いわゆる AI 支援プログラミングについても書きたい。2024 年は Cursor の補完でオープンソースの夏のタスクを終えた。それ以降の AI 支援には、正直あまり意識を向けていなかった。5 月までは、やはり手で書くべきで、AI に任せると実装の細部を取りこぼす、と思っていた。

指導教員の横断プロジェクトを手伝うとき、Trae で AI にコード生成を任せてみた。一気に数万行を書かれ、驚いた。正しいかどうかは別として（もちろんバグもある）、一気に万行を出せること自体が、注意すべきだと思った。

あとの展開は周知のとおり。年末には汎用ソフトウェアの領域（Linux カーネルや合意プロトコルが絡むところでは AI の役割はまだ限定的）で、純手書きコードを標榜する人はもういない。

ただ、プログラマと vibe coder を分けるのは、やはりプログラミングへの深い理解だと思う。良い道具は効率を十倍にできるが、まずプログラマとしての素養が要る。

今年のレストラン・オブ・ザ・イヤーは浜寿司だろう。何度も行った。スシローは後から一回行って人民元 300 元を超えるほどかかり、もう怖くてあまり行けない。

幼なじみが 7 月に北京でインターンし、一か月ほど再会した。その後はオーストラリアの学校に戻った。彼が語る異郷の孤独を自分がどこまで共感できるかは分からないが、自分にできることは限られていて、できる範囲で応えた。

才能の在り処：

相変わらず不安だ…が、正しい方向には進んでいる。頑張ろう。

Hawstein さんの文章を読んでから、何かが芽生えた。

8 月は一週間ちょっとしか帰省せず、威海で数日海を見て、食べ歩きした。

どの道を選んでも、結局今の自分になる。

9 月には姪も幼稚園に入った。清明に帰省して従兄弟の結婚式に出たとき、姉がまた妊娠していると聞き、その後男の子だと教えてもらい、12 月末に無事出産した。姉と義兄におめでとう。

9 月と 10 月はアルゴリズム問題を集中的にやったが、その後研究でまた止まった。昨日の面接でアルゴリズムが書けず、暇を見つけてまた刷り直している。

vibe coding の別の側面も見ておくとよい。

母のスマホが重すぎたので替えてあげたく、結局 17 Pro Max を買い、自分は母の OPPO を使っている。OPPO は Google フレームワークが入っていて、とても快適だ。

10 月末にようやく LeetCode Hot 100 を終えた…

12 月に開題答弁（研究計画の口頭審査）があり、なんとか無事通過した。次は 2026 年 12 月の中期答弁。そのあいだに論文を発表できれば、審査員も無理難題はしてこないだろう。

いくつかの考え。

12 月末に先輩が北京に来て、食事をし、よく喋った。先輩のことがより分かり、彼らの付き合い方の一端も窺えた。

今年の大きな変化の一つは、多くの時間を彼女と過ごしたことだ。クリスマスも、友人たちと年越しも、フェイシャルケアも一緒だった。来年も一緒に歩こう。

そして 2026 年は論文を出し、良いインターンを見つけたい。まずはそこを越えてから他の話をしたい。基礎を固める。

新しい年も、目でよく見、耳でよく聞き、小さな細部を逃さず、考え続けよう。

2025.12.28

2025-12-28T00:00:00.000Z

2025.12.28

月曜は手元の仕事に関連する論文をあさっていて、検索すればするほど増え、ついでにサーベイ論文を一篇書けるかもと思った。先輩に聞いたら、IJCAI に出せるとのこと。火曜に整理した文献リストを送った。

月曜の夜は先輩三人と中关村の「庭院江南菜」で食事。研究の話をたくさん聞いた。一人は研究が強く、外向的で気配りもでき、社交がうまく、十時過ぎまで話してから一緒に地下鉄で帰った。

水曜はフロントエンドをまた触り、Dify と Cherry Studio に PR を出した。小さく始めるつもりで、まずテストを書き、バグを直し、少しずつ深く入っていく。

木曜はクリスマス。午前中は彼女と三里屯でホラーではない（微ホラーすらもう無理で、地雷が多い）脱出ゲームをした。そのあと国貿で歩き、写真を撮り、スイーツとコーヒー、王府井付近のイルミも見た。夜は日本料理、高校の同級生と合流してアニメグッズ店（いわゆる「グッズ店」）へ。閉店後はカラオケに二時間、解散は午前一時近く——後半はみんなのテンションも下がり、典型的な低エネルギー勢はこの私である。

土曜の昼にその先輩の一人とビデオ通話し、コードを書くことに重心を置くよう勧められた。サーベイや Infocom のポスター原稿はたぶん向こう側で進める、とのこと。夜は大学の同窓会に出て、近況の話が弾んだ。

金曜から土曜は引き続き Dify／Cherry Studio への PR。日曜は部屋の片付けと個人ブログの体裁調整で、なかなか気に入った。

振り返ると、この一週間は妙に長く感じる——月曜に外食したのがつい最近のはずなのに、ずいぶん前のようにも思える。

https://shemol.tech/

他言語版

中文

English

2025.12.21

2025-12-21T00:00:00.000Z

2025.12.21

表現力を上げる必要があると感じ、週記をまた書き始めることにした……

あと、記事を読んでも一度流し読みして終わりで、あまり定着していない。書けば考えももう少し沈殿するかもしれない。

先週末は AI Maker Summit に行った。きっかけは李博杰先生が fedi で講演に行くと書いていて、サミットのサイトを見たらチケットが三百元台だった。少し迷って痛い目で申し込んだ。現地に着いてみると博杰先生の講演はなく、翌日 fedi で李博杰先生はアメリカに行ったらしいと知った。金曜に彼がブログでシリコンバレーの AI 見聞を書いていて面白く、二、三度読み返した。

https://01.me/2025/12/silicon-valley-ai-insights-2025/

個人的に役立ったのは AI コーディングのベストプラクティスの部分。タスクを分割し、AI に書かせるコードを一タスク 500 行以内に抑える。異なるモデルでコードレビューに回すのもよい。

AI Maker Summit 全体を通して、島姐（ダオジェイ）の講演、ポストトレーニング関連の一つ、投資家の講演がいちばん面白かった。投資家の「我々はものすごくたくさんのプロジェクトを見てきた……」という一言が、どっしりした感じがして好きだった。

島姐の講演で、隣のホールのあとに予定されていた agent memory system の話が出てきた。大規模モデルが記憶問題を完全に解決したら、そのようなプロジェクトはそもそも存在し得ない、という趣旨だった。

かなり刺さった。博杰先生のブログとも重ねて、インディー開発や小規模事業は自分のニッチをはっきりさせ、製品がモデルの強化で飲み込まれないようにしつつ、大手に先を越されないようにする必要がある。エンジニアであっても、大規模モデルの動向を押さえるために AI 論文や各社の tech report を読むべきだと思う。

終了から一、二日後に AI Maker Summit のグループに入れられ、翌日ある創業者が Product Hunt の宣伝を流した。

読書そのものは AI に置き換えられない、という考え自体は自分も同意なので、Product Hunt を覗いた。有名な人と一冊の本を読む、というサービス。アプリを試したら本当に面白かった。

横に Jobs と Munger の発言が並んでいて、以前読んだ『Poor Charlie's Almanack』や『スティーブ・ジョブズ』などの本を思い出した。過去に読んだ本の復習にもなり、つながりも見えやすい。Discord で 50% オフをもらって、躊躇なく Annual Plan を契約した。まとめ買いは得だから。

Readever で Tony Dinh の My Indie Book を続けて読んでいる。後半は少し飽きて、早く読み終えたくなってきた。今夜か明日には読み終えるかもしれない。

さきほどまた面白い例を見た。

Jason Young 氏が OpenRouter のチャット形式を Claude Code 互換に直すのに多大な労力とお金をかけたが、すぐに OpenRouter が互換 API を出した、という話。

Tony Dinh の本にも似た選択が出てくる。

今週の最初の三日は開題（研究計画）の発表準備に費やした。十分準備したつもりだったが、審査の先生には「プロダクトマネージャーが製品を説明しているようだ」と言われた。後から発表した同門によると、ある先生は七十点台をつけたらしい。院で再度の口頭審査が必要かはまだわからず、結果は来週……

今年の年次総括は 31 日まで待つことにした。毎日サプライズがあり得るから、一年の終わりは最終日まで待ちたい。

bytedance-frontend-eg-camp-ja

2025-11-10T00:00:00.000Z

バイトダンスフロントエンド工程トレーニングキャンプオンライン試験

単一選択とプログラミングに分かれていた。おおまかな知識点を記録する。

単一選択

主にデータ構造とアルゴリズム、コンピュータネットワーク、HTML・CSS・JavaScript の基礎。

データ構造とアルゴリズム

大学一年か二年のデータ構造・アルゴリズム試験を思い出す感じ…

ソート（バブル、クイックなど）が二、三問。

アルゴリズムの計算量はごく簡単な一問。

二分木の走査も二、三問あった印象。

スタックに関する問題が一問。

コンピュータネットワーク

トランスポート層の非信頼プロトコルは何か

UDP。

DNS パケットに関する問題も一問

覚えているのは、選択肢 A が「QR が 0 ならクエリ、1 ならレスポンス」だったことだけ。

HTML、CSS、JS

ブラウザごとの margin / padding をどう揃えるか

CSS Reset

``css


* {
  margin: 0;
  padding: 0;
}


Normalize.css もあった気がする。あとでちゃんと学ぶ。
CSS の float に関する問題で、誤った使い方はどれか
選択肢に
A. float: **
B. float: none
C. float: left
D. float: right
とあって、とにかく A を選んだ。
親要素の高さが潰れる（height collapse）のをどう直すか
選択肢は忘れた。まだよく分かっていない。

1. ::after 疑似要素でクリア。

2. モダンな方法：display: flow-root。

3. BFC を発火させる：overflow 系。欠点：overflow: hidden の本業は「はみ出しを隠す」こと。ドロップダウン、シャドウ、ツールチップなど親の外に出したい子があると切れる。


次のうち BFC の応用に当たるのは
BFC（Block Formatting Context）、ブロック整形コンテキスト。
BFC の応用：

1. 内部フロートのクリア（いちばんよくある）：子に float: left/right があり親の高さが潰れる。親に overflow: hidden や display: flow-root を付ける。

2. 垂直マージンの相殺（Margin Collapse）の防止：通常のフローでは隣接する兄弟ブロックの垂直マージン（margin-top と margin-bottom）が折りたたまれ、大きい方だけが残る。どちらか一方（または両方）を新しい親で包み、その親で BFC を発火させる（例：overflow: hidden）。

3. 適応型の二段／三段レイアウト：片側固定幅、もう片側が残りを埋める（左メニュー float: left、右メイン）。左を float: left（固定幅）。右のメイン側で BFC を発火（例：overflow: hidden や display: flow-root）。


面接では「次の属性のうち BFC を発火できるのはどれ？」という言い方もある。
よくある発火の仕方：

overflow: hidden; / auto; / scroll;（定番のハック）

display: flow-root;（いちばんモダンで意味としてきれいな「BFC トリガー」）

float: left; / right;（浮動要素自身が BFC を作る）

position: absolute; / fixed;（絶対配置要素が BFC を作る）

display: inline-block;

display: table-cell;

Flex / Grid の子（flex item / grid item）

面接で overflow: hidden や display: flow-root が「高さの潰れ」「マージンの折りたたみ」「二段レイアウト」の文脈で出てきたら、それは BFC の応用と考えてよい。

JS の requestAnimationFrame


JS の赤本を眺めたがまだよく分からない。また後で。

setTimeout と Promise.then() の出力順


JS は実行時にタスクを三種に分ける。
同期タスク（Synchronous Code）：コールスタックですぐ走るコード

マイクロタスク：同期が終わった直後に走る。Promise.then() と .catch() のコールバックが代表例。

マクロタスク：同期とすべてのマイクロタスクのあと、キューから一つずつ。setTimeout() と setInterval() のコールバックがマクロタスク。

css
console.log('1. 同步代码：开始');
// 安排一个宏任务
setTimeout(() => {
  console.log('2. 宏任务：setTimeout 1');
}, 0);
// new Promise 的执行器是同步的
new Promise((resolve, reject) => {
  console.log('3. 同步代码：Promise Executor');
  
  // 在 Promise 内部安排一个宏任务
  setTimeout(() => {
    console.log('4. 宏任务：setTimeout 2 (在Promise内部)');
    resolve(); // 在这个宏任务中，Promise 状态变为 fulfilled
  }, 0);
}).then(() => {
  // 当 promise被 resolve() 时，这个 .then() 才会被放入微任务队列
  console.log('5. 微任务：Promise.then 1');
});
// 安排一个立即 resolve 的 Promise
Promise.resolve().then(() => {
  console.log('6. 微任务：Promise.then 2');
});
console.log('7. 同步代码：结束');

1. console.log('1. 同步代码：开始') を実行する

2. setTimeout 1 に遭遇し、そのコールバックをマクロタスクキューに入れる

3. new Promise に遭遇し、すぐに同期実行される executor 関数に入る。console.log('3. 同步代码：Promise Executor') を実行する

4. setTimeout 2 に遭遇し、そのコールバックをマクロタスクキューに入れる

5. Promise.resolve().then() に遭遇。この Promise はすぐ resolved なので、その .then コールバックをマイクロタスクキューに入れる

6. console.log('7. 同步代码：结束') を実行する


7. マイクロタスクキューを空にする
8. 最初のマクロタスクを取り出して実行する
9. 再度マイクロタスクキューをチェックする

10. 次のマクロタスクを実行する。同一タスク内で resolve() が呼ばれる。resolve() が関連する .then をトリガーし、そのコールバックをマイクロタスクキューに入れる


11. マイクロタスクキューを空にする
プログラミング問題
ACM 形式はまだ慣れない。牛客で増やす。
与えられた連立方程式から A、B、C の値が与えられたとき、実数解がいくつあるか
形：
X² + A²Y² + C = 0
Y² + Z² + B = 0
Z² + A = 0
数学問題…式を整理して場合分けすればよさそう。
桁数が k の整数のうち、各桁の和が m になるものはいくつあるか。
例：k=2、m=3 なら 12、21、30 の三つ

python
import functools
def solve_digit_sum(k:int,m:int)->int:
	@functools.lru_cache(None)
	def count_sequences(digits:int,target_sum:int)->int:
		if target_sum < 0:
			return 0
			
		if target_sum > 9*digits:
			return 0
			
		if digits == 0:
			return 1 if target_sum==0 else 0
			
		total_ways = 0
		for d in range(10):
			total_ways += count_sequences(digits - 1,target_sum - d)
		
		return total_ways
		
		
	if k<=0:
		return 0
		
	final_count = 0
	
	for d1 in range(1,10):
		final_count += count_sequences(k-1,m-d1)
		
	return final_count

もう一問はたしか：

「コスト」を単純パス上の辺の重みの最大値と定義する。無向の単純連結グラフで、ノード対（u, v）のうち、最小コストがちょうど k になるものがいくつあるか、という趣旨だった。

難しすぎるので、いったん保留にした。

Context-Engineering-for-AI-Agents-with-LangChain-and-Manus-ja

2025-10-20T00:00:00.000Z

LangChain と Manus に見る AI エージェントのコンテキストエンジニアリング

数か月前、Manus がコンテキストエンジニアリングについて書いていた。

https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

エージェントのメッセージ履歴にすべてのコンテキストを載せる必要はないので、コンテキストのオフロードが要になる。

LangChain 側の話

コンテキストをファイルシステムへオフロード

定番のアイデアのひとつが ファイルシステム を使うこと。ツールメッセージの出力を例にすると、全文をそのまま履歴に戻さずファイルに書き出し、エージェントには必要最小限（参照用の手がかりだけ）を返す。Web 検索のようにトークンが重い結果を、ずっとコンテキストウィンドウに載せ続けない。

コンテキストの削減（リダクション）

要約や圧縮でコンテキストを減らす。ツール呼び出し結果の要約は直感的な一手。古いツール呼び出しと出力を剪定する考え方は、Claude の SDK などに組み込まれつつある。Cognition（エージェントアプリ）も、エージェント間ハンドオフでの要約に言及している。

コンテキストの取得（リトリーブ）

Claude Code は主にファイルシステムと単純な検索（glob / grep）に寄せている。オンデマンドでコンテキストを取りにいく方法はいろいろある。インデックス＋意味検索と、ファイル＋単純検索の両方が有効になりうる。

コンテキストの分離（アイソレーション）

特にマルチエージェントでは重要。サブエージェントごとにコンテキストウィンドウを分け、関心の分離ができる。

コンテキストのキャッシュ

langchain の open deep research：

https://github.com/langchain-ai/open_deep_research

三フェーズ：研究範囲のスコーピング、マルチエージェントで行う 研究本体、最後の ワンショット執筆。オフロードで研究計画のブリーフをコンテキストにべったり載せず別に保存し、状態やファイルシステムから参照する。研究計画を作り→オフロード→作業のあと必要なときだけメッセージ末尾に戻して執筆フェーズに使う。観察の要約でトークン重いサーフ系ツール呼び出しを削減し、研究内のサブエージェント間ではアイソレーションも使う。複数プロジェクトにまたがるアイデアの要約になっている。

Manus 側の話

早い段階から専用モデルに寄りすぎず、できるだけ長く 汎用モデル＋コンテキストエンジニアリング に頼るべき、というスタンス。

コンテキスト削減：コンパクション vs 要約

Manus では各ツール呼び出しと結果に フル形式 と コンパクト形式 の二通りがある。コンパクト版は、ファイルシステムや外部状態から 再構成できる情報を削る。例：ファイル書き込みツールが path と content を返したあと、環境にはファイルが既にあるなら、コンパクトでは長い content を落として path だけ残せる。エージェントが賢ければ必要時にパスから読み直せる。可逆性が重要で、過去の行動・観察に連鎖して予測するため、どの過去が後で効いてくるかは事前にわからない。コンパクションはこの意味で可逆な削減。

一方、コンパクションだけではいずれ上限に当たるので、要約と組み合わせる。要約の前に重要部分をファイルへオフロードしたり、要約前の全文をログとして捨てず保存したりする。glob/grep でログから復元も可能。

コンパクションは可逆だが要約は不可逆。両方とも長さは減るが振る舞いは違う。

共存のため コンテキスト長の閾値 を追う。ハード上限（例：100 万トークン）の手前で、実用上 コンテキスト腐敗（繰り返し・遅い推論・品質低下）が始まる帯（だいたい 128k〜200k 前後を評価で特定）を 削減トリガ にする。まずコンパクションから。コンパクションは 古いツール呼び出しの半分だけ など、新しい方はフルのまま残してツールの使い方の「生きた例」を失わないようにする（さもないとモデルがコンパクト形式を真似てフィールド欠落を出す）。コンパクション後の 実際の空き を測り、利益が小さければ要約へ。要約には 常にフル版データ を使い、直近のツール呼び出し・結果は数件は要約せずフルで残して「どこまで進んだか」を維持する。

コンテキスト分離：「共有メモリで通信するな」

Cognition のブログでも、マルチエージェント間の情報同期は悪夢になりがち、とある。Go の言い回し：「共有メモリで通信するな。代わりに通信によってメモリを共有せよ」

https://chatgpt.com/share/68f4f8c3-baac-8004-9cf7-421375260909

エージェントに置き換えると 「通信」 はメインがプロンプトだけをサブに渡し、サブのコンテキストはその指示だけ、という古典的サブエージェント。「共有メモリ」 はサブがこれまでのツール履歴全体を見るパターン。タスクが短く明確で最終出力だけ欲しい（コードスニペット検索など）は通信型で単純に。複雑なディープリサーチのように中間の検索・メモが最終レポートに効くなら共有コンテキスト型の方が、全部ファイルに落として読み直すより遅延・トークン的にも合理的なことが多い。ただし共有は prefill が太くなり、システムプロンプトとアクション空間が違うと KV キャッシュを再利用しにくくコストが上がる。

コンテキストオフロード：階層化されたアクション空間

「オフロード」は作業コンテキストを外部ファイルへ、が基本だが、規模が大きくなると ツール定義自体 がコンテキストを食い、コンテキスト混乱（誤ツール・存在しないツールの呼び出し）を招く。動的 RAG でツール説明を都度読み込む手もあるが、ツール定義が先頭にあると KV が毎回リセットされがちで、過去の「ツール削除」呼び出しが履歴に残るとモデルを混乱させうる。

Manus は三層を試している：(1) 関数呼び出し — スキーマ安全（制約付きデコード）だがツール多すぎは混乱。だから 固定数の原子関数（ファイル読み書き、シェル、検索、ブラウザ操作など）に絞る。(2) サンドボックスユーティリティ — セッションはフル VM。シェルから事前インストール済みコマンド（変換、音声認識、MCP を CLI 経由で叩く MCP CLI など）を使う。関数空間に MCP ツールを直注入しない。新能力はモデルの呼び出し空間を触らずにコマンド追加で足せる。大きい出力はファイルへ。grep/cat/less で処理できる。対話的 UI との低遅延往復には向きにくい。(3) パッケージと API — Python スクリプトで事前承認 API やパッケージを呼ぶ。株価の年間データのように、数値全部をモデルに入れずスクリプトで集計し要約だけ戻す。コードは合成しやすいが スキーマ安全ではない。インタプリタ／ランタイムで捌けるものはコード、それ以外はユーティリティや関数呼び出し、のハイブリッド。

モデルから見ると三層とも最終的には 標準的な関数呼び出し（シェル経由、ファイル＋シェル実行など）に収斂し、インタフェースは単純でキャッシュにも有利。

五つの次元をつなぎ、過剰設計を避ける

オフロード・削減・取得・分離・キャッシュは独立ではない。オフロードと取得が効率的な削減を可能にし、安定した取得が分離を安全にする。一方で分離はコンテキストを遅くし削減頻度も変える。分離と削減はキャッシュ効率や出力品質にも効く。コンテキストエンジニアリングは 相反しうる目標のバランスの科学であり技術。

最後に逆のことを言う：コンテキストの過剰設計は避けてほしい。Manus 公開から半年ほどで最大の伸びは、凝った管理層やトリッキーな検索より 単純化と不要な細工の削除、モデルをもう少し信頼すること にあった。アーキテクチャを簡略化するたびに速く、安定し、賢くなった。目的はモデルの仕事を 簡単にすること であり、難しくすることではない。build less and understand more を一つ持ち帰るならそれ。

Q&A

講演後の質疑応答を、元の英語対話の流れに沿って日本語訳したものです（話者の補足・Lance 氏のフォローも含みます）。

Q&A — シェルツールとサンドボックス

Q: LLM はさまざまなシェルツールをどう呼び出すのか。どんなツールが存在し、どう起動するかをどう知るのか。Manus の多層サンドボックスの話も少し聞きたい。 A: まずシステムプロンプトにヒントがあり、プリインストール済みのコマンドラインユーティリティが特定フォルダにある、と伝えている。よく使うものについてはシステムプロンプトにコンパクトに埋め込む。ただし各ツールの 使い方までは書かない。一覧だけ示し、すべて自前チーム開発で形式が揃っているので、--help フラグを安全に使える、とエージェントに伝えている。

Q&A — インデックスとファイルシステムによる文脈取得

Q: ファイルシステムの話が多かったが、インデックス化についてはどう考えるか。扱う文脈が十分に大きくなったときに、オンデマンドでベクタストアを立ち上げるようなことはするか。 A: この領域に唯一の正解はない。Manus では インデックス DB は使っていない。各サンドボックスはセッションごとに新しく、ユーザーは素早い対話を求めるので、オンフライでインデックスを構築する時間がない。だから Claude Code に近く、grep や glob に頼る。一方、長期記憶やエンタープライズナレッジベースのように 情報量が桁違い の場合は、外部のベクターインデックスが依然として必要になる。規模と用途による。 Q: ユーザーが Manus アカウントで多くのセッションをまたいで使うとき、記憶という概念はあるか。Claude Code の Claude MD のようにセッション横断で残るものは。 A: Manus には knowledge と呼ぶ、ある種の 明示的メモリ がある。例えば「毎回 Excel で渡して」と言うと、自動でメモリに挿入されるのではなく、「以前の会話からこう学びました。保存しますか？」というダイアログが出て、ユーザーが承認か拒否かを選ぶ。より自動に近づける方法も研究中。エージェントはチャットボットよりユーザーが訂正することが多く、例えばデータ可視化で中日韓フォントの問題が起きると、ユーザーが「CJK フォントを使え」と繰り返し指摘する。こうした 集合的フィードバック を、パラメータを増やさないオンライン学習で活かせないか、という方向もある。

Q&A — 進化するモデルへの適応

Q: 終盤、足場を削ったことで得たものが大きかった、とあった。モデル能力が上がるからだとも思う。時間とともにモデルが良くなり足場を外せるのは大きな課題だ。数か月ごとにアーキテクチャを見直してモデルが良くなるたびに削除していくのか。 A: とても良い質問。Manus はすでに 5 回大きくリファクタ している。3 月ローンチから 10 月までで 5 回。止まれない。モデルは強くなるだけでなく 挙動そのものが変わる。モデルプロバイダと密に働くのも一手だが、内部では エージェントアーキテクチャを固定したまま弱いモデルと強いモデルを切り替える 評価をしている。弱い→強いで大きく伸びる設計は、将来「今日の強モデル＝明日の弱モデル」になっても持ちやすい。1〜2 か月ごとにレビューし、OSS や早期アクセスのプロプライエタリモデルで次のリリース前に準備することも多い。

Q&A — データ保存フォーマット

Q: データを保存するときのベストプラクティス。Markdown、プレーン、ログなど、何を優先するか。 A: プレーンか Markdown かというより、行指向（line-based） を優先する。モデルが grep や行範囲読みをしやすい。Markdown は便利だが、モデルによっては 箇条書きを出しすぎる 癖がある（名前は伏せる）。だからプレーンを増やす方向も取る。

Q&A — 要約のプロンプト設計

Q: コンパクションと要約の話に続き、要約のプロンプトはどうするか。要約は不可逆なので、プロンプトが悪いと情報を失う。再現率（recall） を高めるプロンプト、どう考えるか。 A: 要約プロンプトはかなり最適化を試したが、うまくいったのは 自由形式で AI に全部書かせない こと。スキーマ（フォーム）を決め、フィールドを埋めさせる。例：変更したファイル、ユーザーの目的、どこまで進んだか。こうすると出力が安定し、反復改善しやすい。自由形式の要約だけは避ける、が実務的な答え。

Q&A — 検索結果のコンパクション

Q: コンパクションについて確認したい。検索ツールの生出力が生メッセージで、コンパクション後はファイル名だけ、という理解で合っているか。 A: そう。ツール呼び出しだけでなく ツール結果 にも適用する。Manus では、ファイルシステムや外部状態にオフロードできれば ほぼすべての操作が可逆 に近い。多くのタスクにはすでに一意な識別子がある。ファイル操作ならパス、ブラウザなら URL、検索ならクエリ。 Lance: 検索を使うエージェントで、トークン過多のツール結果をメッセージ履歴に全部戻したくない。要約やコンパクションで要約だけ返すこともしたが、次の判断に全部の情報が必要なこともある。巨大なブロックを履歴に置き続けたくない。全体を戻して後で消す（Claude のやり方）、先に要約、全部載せてからコンパクションでファイルへのリンクだけ残す、など選択肢があるが、どう考えるか。 A: シナリオ次第。複雑な検索（単一クエリではない、複数クエリで重要なものだけ集める等）は サブエージェント（内部では agent as tool）に任せる。モデルから見ると advanced_search のような関数だが、裏は固定出力スキーマのワークフロー型サブエージェント。単純な Google 検索などは フル詳細をコンテキストに載せ、あとからコンパクションに頼る。また、コンパクションが思ったより早く来るかもしれないので、中間の洞察や重要発見をファイルに書かせる ように指示している。これがうまくいけば、時間が経って無関係になった古いツール呼び出しをコンパクションしても損失は小さい。

Q&A — エージェント間通信と MapReduce

Q: agent as tool は有効だが、エージェント間通信の問題も出る。Cognition の Walden Yen 氏も Devin で大きな課題だと書いていた。十分な情報を渡しつつ、サブの prefill を過剰にしないには。 A: 先月 Wide Research を出した。内部では agentic MapReduce と呼んでいる。Manus はセッション背後にフル VM があるので、メインからサブへ文脈を渡す一つの方法は 同じサンドボックスを共有 し、パスだけ渡すこと。サブへの情報送信自体はそれほど難しくない。難しいのは 各エージェントから正しい出力を得ること。メインがサブを複数起動するときは、出力スキーマをメインが定義 し、サブ側に submit_result という特別なツールを用意し、制約付きデコード でメインが定義したスキーマどおりに返すようにする。スプレッドシートのように集約され、スキーマで形が決まる。 Lance: Manus の設計で繰り返し出るテーマだ。要約でもエージェント間でも スキーマを契約 にして、構造化された十分な情報を渡す。

Q&A — モデル選択とオープンモデル

Q: Anthropic を使っていると思うが、オープンモデルやファインチューニング、KV キャッシュの観点は。 A: 現状オープンソースモデルは使っていない。面白いことに理由は品質ではなく コスト。OSS は安くなるイメージがあるが、Manus の規模で 本物のエージェント（入力が出力より遥かに長い）を作ると KV キャッシュが極めて重要 で、分散 KV は OSS だけでは実装が難しい。フロンティア提供側の方がグローバル分散キャッシュの基盤が固く、計算すると フラッグシップの方が安い こともある。Anthropic だけでなく Gemini や OpenAI の進展も見ている。コーディングは Claude、マルチモーダルは Gemini、複雑な数学・推論は別、など タスクやサブタスク単位でルーティング できるのがアプリ会社の強み。 Lance: KV キャッシュで、プロバイダのどの機能を使っているか。Anthropic の input caching など。

（※本パートでは具体的プロダクト名のキャッシュ機能について、講演では Anthropic の input caching 等に言及していた。）

Q&A — ツール選択と階層化アクション空間（再訪）

Q: ツール説明のインデックスや意味類似で都度取得は使わない、とあった。ツールが多すぎる閾値は。ツール選択は古典的な難題だが。 A: まずモデルによる。経験則として 30 を超えるツールは避けたい（頭の中の雑な数字だが）。汎用エージェントなら ネイティブ関数は極限まで原子化 するので、実際アクション空間に入れる原子関数はそれほど多くない。Manus ではだいたい 10〜20 個、あとはサンドボックス側。動的に引っ張る必要が薄い。 Lance: エージェントが直接呼べるツールが 10 個でも、スクリプトを書いて実行すれば実質的なアクション空間は爆発的に広がる。汎用ツールでそれを賄う、という理解でよいか。 A: だから Manus を汎用エージェントと言い切れる。コンピュータ上で動く から。コンピュータはチューリング完全で、ジュニアインターンが PC でできることは理論上エージェントも可能。シェルとテキストエディタがあればかなり完結し、あとはサンドボックスにオフロードできる。 Lance: コードエージェントでは毎回スクリプト生成→サンドボックス実行がツール呼び出しのように見える。Manus は直接ツールとサンドボックスのハイブリッドか。 A: 非常に重要。全部コード（Codec）に寄せる のも試したが、コードだと 制約付きデコードが使えず 破綻しやすい。コードは先に述べたように大量データ処理など特化用途に強い。だから ハイブリッド が良い。

Q&A — プランニングと To‑Do

Q: Manus の to‑do ツールや、冒頭でタスクリストを作る話。 A: 当初は to-do.md パラダイムだったが、婉曲に言うと ターンをかなり浪費 する。3〜4 月頃のログでは、行動の 3 分の 1 が To‑Do 更新 だった。今は 構造化プランニング。画面下のプランナーは内部では agent as tool で別エージェントが計画管理。最新版では to-do.md 依存はやめた。todo.md でも良い結果は出るが、トークン節約なら別手段を。

Q&A — マルチエージェント設計と役割

Q: プランニングエージェントが計画オブジェクトを出しサブを起動する、といった分割。推奨するサブエージェントの数は。 A: 設計次第だが、Manus は 典型的な「役割別マルチエージェント」ではない。デザイナ／プログラマ／マネージャのように分けるのは 人間会社のやり方の比喩 で、人間のコンテキスト限界の反映に過ぎない。Manus もマルチエージェントだが 役割で分割しない。巨大な汎用実行、プランナー、ナレッジ管理、データ API 登録など ごく少数。サブを増やすと通信が地獄になるので、増やす代わりに agent as tool に寄せる。 Lance: 人間組織図の比喩でサブエージェントを分けるのは見かけるが、無理なアナロジーかもしれない。ナレッジマネージャのタスクは何か。 A: ナレッジシステムがあり、ナレッジエージェントは ユーザーとエージェントの会話をレビューし、長期記憶に何を残すべきか を判断する。

Q&A — サンドボックス環境の安全とガードレール

Q: インターネット接続サンドボックスの安全、ガードレール。 A: インターネット付きサンドボックスは 何でも危険。ガードレールに力を入れ、少なくとも 情報がサンドボックス外に出ない ようにしている。プロンプトインジェクション対策で 外向きトラフィックを検査 し、トークン類が外に出ないようにする。ユーザーが意図的に外に出したい場合は、情報を落とす処理などでサンドボックス外への流出を防ぐ。ブラウザはさらに難しく、ログイン状態の永続化とページ内容の悪意（プロンプトインジェクション）が絡む。コンピュータ利用モデル のプロバイダ（Anthropic、Google 等）と密に連携し、ガードレール強化を待つ部分もある。今はブラウザやサンドボックス内の敏感操作で 手動確認 を求め、ユーザーが承認しないと自分で操作し続ける必要がある。モデル側のガードレールが良くなれば手動は減らせる、という漸進的アプローチ。

Q&A — 評価（Eval）

Q: 評価の話。Claude Code はコード eval は飽和気味で非公式 eval とドッグフード、など。Eval は有用か、何が有用か。 A: ローンチ当初は Gaia など学術ベンチを使ったが、ユーザー好みとずれる ことがわかった。今は三種類。(1) 最重要：完了セッションごとのユーザー 1〜5 星。平均評価がゴールドスタンダード。(2) 正解が検証可能な 内部自動テスト と、読み取り専用中心の既存ベンチではなく 実行・トランザクション系 に寄せた自前データセット（サンドボックスで環境をリセットしやすい）。(3) インターン等の人間評価 — サイト生成やデータ可視化は「見た目が良いか」の報酬モデルを設計しにくい。味（taste）の問題。

Q&A — 検証可能報酬 RL とツール呼び出しエージェント

Q: 検証可能報酬付き RL の潮流と、ツール呼び出しエージェントの対比。Claude Code はハーネス上で RL できる。自前 RL は。オープンモデルとの関係。 A: 事前学習・ポスト学習・RL は長くやってきたが、リソースが十分なら試す価値はある。ただし MCP はゲームチェンジャー で、固定行動空間でないと 報酬設計が極めて難しく、ロールアウトとフィードバックのバランスも崩れる。MCP 対応モデルを自前で作るのは 事実上ファウンデーションモデル開発 に等しい。コミュニティのモデル企業が同じことをしている。今は RL にそれほど時間をかけず、パラメータフリー の個人最適化や集合フィードバックを探っている。 Lance: Anthropic が Claude Code のツール群で検証可能報酬 RL をしたとすれば、同じツール名・同じ説明 をハーネスに載せれば同様の能力を引き出せるか。 A: 明確な答えはある。同じ名前は使わない方がよい。自前関数は要件や引数が違う。モデルがポストトレーニングで見た「公式ツール」と混同させたくないから。

context-engineering-ai-agents-langchain-manus-ja

2025-10-20T00:00:00.000Z

AI エージェントのためのコンテキスト工学（LangChain と Manus）

数か月前、Manus は Context Engineering について書いたブログを公開した。

https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

すべてのコンテキストをエージェントのメッセージ履歴に積む必要はない。だからコンテキストのオフロード（offloading）が要る。

LangChain 側の知見

コンテキストをファイルシステムへ卸す

よくあるのはファイルシステムの利用だ。例：ツールの返り値が重い——全文をディスクに書き、エージェントの推論に必要な最小限の要約だけ会話に戻す。細部が要るときだけオンデマンドで読む。こうすればウェブ検索のようにトークンが爆発する結果が、ウィンドウを永遠に占有しない。

コンテキストの圧縮

要約や圧縮で負荷を下げる。ツール出力の要約は自然な一手だ。古いツール呼び出しとその出力を削る（Claude などの SDK でもますます一般的）。Cognition などのエージェントアプリも、エージェントの引き継ぎで要約により「承認／ハンドオフ」する話をしている。

オンデマンドでコンテキストを取り戻す

Claude Code はほぼファイルシステムと簡単な検索ツール（特に glob／grep）だけに頼る。インデックス＋意味検索でも、純粋なファイルシステム検索でも、十分効く。

コンテキストの分離

マルチエージェントでは特に重要。各サブエージェントが独自のコンテキストウィンドウを持ち、関心の分離しやすい。

コンテキストのキャッシュ

LangChain の open deep research：

https://github.com/langchain-ai/open_deep_research

三段階：研究スコープの確定 → マルチエージェントで研究 → 最後に一括ライティング。オフロードを使う：まず研究 brief で計画を定義し、外部に保存しておき、brief を主コンテキストにずっと載せない（後から他の情報に薄まる）。brief は独立保存し、グラフ状態やファイルシステムから取り戻せる——研究を大きく回したあと、必要に応じてメッセージリスト末尾へ再投入し、執筆段階に使う。研究フェーズ内部では、reduction 要約でサーフ系ツールの大量観察を圧縮し、サブエージェント間の context isolation で隔離する——一つのプロジェクトに複数の手法をまとめた形だ。

Manus 側の知見

早すぎる専用モデル化は避け、スタートアップはできるだけ長く汎用モデル＋コンテキスト工学に寄せるべきだ、という立場。

コンテキスト圧縮：Compaction と Summarization

Manus では、各ツール呼び出しと結果に完全版とコンパクト版がある。コンパクト版は、ファイルシステムや外部環境から再構築できる情報を落とす。例：ファイル書き込みツールの返り値に path と content がある。ディスクに書いたあとは、コンパクト版では長大な content を捨て path だけ残せる——エージェントが十分賢ければ必要時にファイルを読めばよく、情報は失われていない。単に外部化しただけだ。この可逆性が重要。エージェントは過去の行動と観察を連鎖的に参照し、十歩先でどの行動が急に効いてくるか分からない。

Compaction だけでは限界があり、コンテキストは依然として上限に当たる。そこで従来の summarization と組み合わせるが、非常に慎重に——例：要約の前に重要段落をファイルへオフロードする。攻めた場合は要約前のコンテキスト全体をテキスト／ログにダンプし、後から復元可能にする。glob／grep でログを辿るだけの人もいる。モデルが十分賢ければ「要約の前」のコンテキストまで取り戻せる。

要点：compaction は可逆、summarization は不可逆。どちらも長さは縮むが、振る舞いはまったく違う。

両立にはコンテキスト長の閾値の追跡が要る。モデルのハード上限は 1M トークンに届いても、だいたい 200k 付近から「context rot」（繰り返し、遅さ、品質低下）が始まる。評価で腐る手前の閾値（よく 128k–200k 付近）を見つけ、近づいたら負荷を下げ、先に compaction、次に summarization。Compaction も履歴全体である必要はない——最も古い 50% のツール呼び出しだけ compact し、新しい方は完全版のままにして、モデルが「正しいツールの使い方」をまねできるようにする。さもなくと、最悪、モデルがフィールド欠損の compact 形式を吐くようになり、逆に壊れる。Compaction 後は実際にどれだけ空いたかを確認し、数ラウンドで効果が小さいなら summarization。Summarization は常に完全データを使い、compact 版は使わない。直近のツール呼び出し／結果のいくつかは要約せず完全版のまま残し、「今どこまでやったか」をモデルに知らせ、トーンのドリフトを防ぐ。

コンテキスト分離：通信と共有メモリ

Cognition のブログの注意：マルチエージェント間の情報同期は悪夢になりうる。マルチプロセス／マルチスレッドの協調は古典的に難題で、Go コミュニティの格言を借りるなら「共有メモリで通信するな。通信によってメモリを共有せよ」。

https://chatgpt.com/share/68f4f8c3-baac-8004-9cf7-421375260909

エージェントに常にそのまま当てはまるわけではないが、二つのパターンを示す。「メモリ」を「コンテキスト」に置き換えると、「通信による」のは古典的なサブエージェント：親が指示を送り、子のコンテキストはほぼそのタスクだけ——短く明確で、最終結果だけ欲しい仕事向け（コードベースの一片を探すなど）。親は子の探索過程より結果だけ欲しい。Claude Code の task tool はよくこう使う。

「共有メモリ／共有コンテキスト」は、子が前の完全なコンテキスト（全ツール履歴）を見られるが、system prompt と行動空間は別、という形。最終レポートのための深い調査では、中間の検索やメモが多く、メモをファイルに書いて子が全部読むより、子に直接コンテキストを共有した方が遅延とトークンを節約できる場合がある。代償は各サブエージェントの prefill が大きく入力トークンが高くなり、system／行動空間が違うとKV キャッシュを共有できずフル料金になること。

コンテキストオフロード：階層化された行動空間

オフロードは作業コンテキストを外部ファイルへ、とよく言う。システムが大きくなり特に MCP を繋ぐとツール定義そのものがコンテキストを食い、ツールが多いと「context confusion」になり、モデルが誤ったツールや存在しないツールを呼ぶ。よくあるのはタスクに応じたツール記述の動的 RAG だが、ツール定義は文脈の前寄りにあり、KV が何度もリセットされる。履歴にはもう無いツールへの呼び出しが残り、モデルを迷わせる。

Manus は階層化された行動空間を試している：モデルが三つの抽象レベルから選ぶ——(1) 関数呼び出し (2) サンドボックス内のユーティリティ (3) パッケージと API。

第一層の関数呼び出し：スキーマは安全（制約付きデコード）だが、ツールが多いと混乱しキャッシュも壊れる。Manus は固定数の原子関数：ファイル読み書き、シェル実行、ファイル／ネット検索、ブラウザ操作など。境界が明確で複雑なワークフローを組み立てられる。残りの能力は第二層のサンドボックスツールへ。各セッションはフル Linux VM で、シェルからプリインストール済みツール（変換、音声認識、コマンドライン経由の MCP——MCP ツールを関数空間に詰め込まず CLI で処理）を呼べる。新能力はユーティリティ追加で足せ、モデルの呼び出し空間を変えなくてよい。大きな出力はファイルへ書くかページングし、grep／cat／less で処理。代償はフロントエンドとの低遅延往復では可視化のチェーンが長くなること。

第三層のパッケージと API：Python でプリ承認 API やカスタムパッケージ（サブスクに API キー込み）を書く。大量メモリ計算が要るが生データを全部モデルに入れたくないタスク向け——例：一年分の株価をスクリプトで集計し要約だけ返す。コードと API を組み合わせ、一ステップに多くの呼び出しを連ねる（Code Act 論文に近い）。欠点は関数呼び出しほどスキーマが安全でなく制約デコードが難しいこと。Manus の方針：コンパイラ／インタプリタの実行時に任せられるものはコード。そうでなければサンドボックスツールか関数呼び出し。モデルから見れば三層とも統一された関数インタフェースで、UI が単純でキャッシュに効き、関数同士が直交する——例：サンドボックスツールもシェル関数経由、第三者 API はファイルに書いてシェル実行、など。

五つの軸をつなぎ、過剰設計を避ける

Offload、reduce、retrieve、isolate、cache は独立ではない：offload＋retrieve が reduction を効かせる。安定した retrieve が isolation を安全にする。isolation は連絡を遅くし reduction の頻度を変える。isolation と reduction はキャッシュ効率と出力品質にも効く。コンテキスト工学は複数目標のあいだのバランスの科学であり芸術だ。

最後の一文は一見矛盾するが：コンテキストの過剰工学は避けよ。Manus 公開から六、七か月で、最大の飛躍はしばしば、より凝ったコンテキスト層や検索テクニックを足すことではなく、単純化し、不要な細工を削り、モデルをもう少し信頼することだった。アーキテクチャを簡素化するたび、システムは速く、安定し、賢くなる——コンテキスト工学の目的はモデルの仕事を簡単にすることであって、難しくすることではない。一つだけ持ち帰るなら：足場を少なく、問題を多く理解せよ（build less and understand more）。

Q&A（要旨訳。原文の意図に合わせる）

シェルツールとサンドボックス

問：LLM はどのシェルツールがあり、どう呼ぶかをどう知る？多層サンドボックスはどう設計？答：システムプロンプトにプリインストール CLI のディレクトリを書き、よく使うツールはコンパクトに列挙。使い方は教えず名前だけ。--help を安全に使える旨を書く（フォーマットは統一）。

インデックス対ファイルシステム検索

問：ベクトル DB、オンザフライで索引？答：絶対の正解はない。Manus のサンドボックスセッションはたいてい新規で素早い対話が要り、索引をその場で建てる時間がない。Claude Code の grep／glob に近い。長期記憶や企業ナレッジなら外部ベクトル索引がまだ要る場合も。情報規模とコードベース／サンドボックスが長期かどうかによる。

セッション横断の記憶

問：Claude の CLAUDE.md のようなセッション横断の永続化？答：Manus には knowledge があり、明示的記憶に近い。「今後ずっと覚えて」と言うとポップアップで採用確認。より自動的な方法も探索中——例：可視化での中日韓フォントの修正が繰り返されるような集合的フィードバックを、パラメータ更新なしのオンライン改善に使う。

モデル進化に合わせたアーキ更新

問：モデルが強くなったら足場を外す。どのくらいの頻度で見直す？答：モデルは良くなるだけでなく振る舞いも変わる。ベンダーと密に連携。内部評価の一つ：エージェントアーキを固定したまま強弱モデルを切り替える——強モデルで伸び大きければアーキはより「未来向き」。Manus は三月公開から十月まで大きな改版を約五回。一、二か月ごとに振り返り、オープンソースや初期クローズドモデルで事前研究もする。

データ保存形式

問：Markdown、プレーンテキスト、ログ？答：行指向を優先し、grep や行範囲読みをしやすくする。Markdown はモデルがリスト記号を使いすぎることがある。

要約のプロンプト

問：summarization は不可逆。どうプロンプトする？答：凝ったプロンプトはいろいろ試したが、シンプルで効くのは完全自由形式にしないこと。複数フィールドのスキーマで表を埋めさせる（どのファイルを変えたか、ユーザーの目的、どこまで進んだか等）。出力が安定し、反復しやすい。

検索結果の compaction

問：検索ツールが重い。情報を残しつつ履歴を抑えるには？答：複雑な多段検索は sub-agent／agent as tool で、外からは一つの「高度な検索」関数に見せ、内部は固定出力スキーマのワークフロー。単純検索はまず完全結果を渡し compaction に頼る。モデルに中間の洞察をファイルへ書かせ、早すぎる compact で失わないようにする。

エージェント間通信と MapReduce

問：agent as tool は効くが、エージェント間は情報をどう渡す？答：Manus の Wide Research は内部的に agentic MapReduce：親子エージェントが同一サンドボックスファイルシステムを共有し、パスで引数を渡す。難所は多路出力のマージ。親は先に出力スキーマを定義し、子は制約デコード付きの submit_result で返す。スキーマ付きの「表」を生成するイメージ。

モデル選択とオープンソース

問：オープンソース、微調整？KV cache？答：現状オープンソースは使っていない。品質だけでなくコストの理由も。エージェントは入力が出力より遥かに大きく、分散 KV cache が重要。大手クラウドの基盤の方が割に合うことも。Anthropic だけでなく、コードは Claude、マルチモーダルは Gemini、複雑推理は OpenAI など、タスクやサブタスク単位でルーティングも可能。

ツール数と階層行動空間（再掲）

問：ツールが多すぎる？答：モデル次第だが、経験上一度に 30 を超えるツールは避ける（おおまかな目安）。汎用エージェントの原子関数は絞る。Manus はだいたい十個台の原子関数で、残りはサンドボックス側。ツール定義テーブルを動的に丸ごと引っ張るのは避ける。

プランニングと todo.md

問：to-do ツール？答：初期は to-do.md パターンで、ラウンドを浪費した（ときに三分の一が todo 更新）。今はより構造化された planner（根底も agent as tool）。最新版は todo.md に依存しない。使っても動くがトークンはかさむ。

マルチエージェントの役割分担

問：プランナー、ナレッジ管理？答：Manus はマルチエージェントだが「デザイナー／プログラマー／マネージャー」といった人間組織の硬い分割はしない——それは人間のコンテキスト限界から来る分業が多い。Manus のサブエージェントは少ない：大きな実行器、プランニング、knowledge 管理、データ API 登録など。追加は慎重。ナレッジエージェントは会話を見て、長期記憶に入れるべきか決める。

サンドボックスの安全

問：ネット接続サンドボックスのガードレール？答：少なくとも機密がサンドボックス外に出ないこと。外向きトラフィックは検査。ブラウザはログイン状態やページ注入など複雑で、企業の能力境界とコンピュータ利用モデルのベンダーとの協業に関わる。敏感な操作は手動確認が多い。ガードが良くなれば人手を減らす。

評価

問：正式な eval はまだ意味がある？答：初期は Gaia など公開ベンチを使ったが、ユーザー嗜好と大きくズレた。今は三種：(1) セッション終了ごとのユーザー 1–5 星（最重要）；(2) 検証可能な答えの自動テスト＋実行寄りの自前セット；(3) 大量のインターンがサイト生成や可視化など「趣味」のタスクを評価——報酬モデルで美しさを判定するのは難しい。

RL と検証可能な報酬

問：自前 harness での RL との比較？答：長年 post-training／RL だが、MCP を支えると行動空間が固定でなく安定報酬と均衡 rollout を設計しづらく、ほぼ自前基盤になる。コミュニティモデル企業がその部分を担う。無パラメータのパーソナライズ／オンライン学習（集合的フィードバックなど）に関心。Claude Code と同名ツールを再利用するか：意図的に同名にしない。post-training データの内部ツールと混同し、パラメータ不一致で誤誘導するのを避ける。

コードエージェント：純スクリプトと混合

問：コードエージェントは毎ステップスクリプト生成してサンドボックス実行？Manus はツール直叩きとサンドボックスが混在？答：重要——Manus をコードだけにしようとしたが、コード経路は制約デコードが効きにくく制御しづらい。コードは大量データをランタイムメモリで処理し結果だけ返す等に向く。関数呼び出し／サンドボックスツールと併用すべき。

Claude Code と「同名ツール」

問：Anthropic が Claude Code ツールで RL している。自社 harness で同名同記述なら似た能力が「解放」される？答：意図的に同名を避ける。自前関数のパラメータと要件が違い、post-training で見た内部ツールと現在実装を混同させたくない。

two-dark-clouds-over-agent-ja

2025-10-19T00:00:00.000Z

エージェントを覆う二つの暗雲：環境とのリアルタイム対話と、経験からの学習

https://01.me/files/agent-learn-from-experience/dist/1

Pine AI 共同創業者兼チーフサイエンティスト

リアルタイム対話の課題

音声対話の遅延が大きい（数十秒スケールに達しうる）

GUI 操作は人間よりおおよそ 3〜5 倍遅い

従来の ReAct ループの直列ボトルネック

ありうる技術的突破

SEAL アーキテクチャ（Streaming, Event-driven Agent Loop）

- 知覚層：音声信号のストリーミング処理

- 思考層：非同期の「観察—思考—行動」を伴う対話型 ReAct

- 実行層：VLA／TTS などのフィードバック閉ループ

経験から学ぶことの課題

中核の難しさ

タスクごとにほぼゼロから始まる

ドメイン知識が蓄積しにくい

「熟練度」が時間とともに上がりにくい

三つの典型パラダイム

1. Post-training：RL などでパラメータを更新

2. In-context Learning：注意機構による「ソフト更新」

3. 外部化された学習

- RAG：経験の永続ストア

- Tool Generation：エージェントの自己進化

姚順雨（Yao Shunyu）は二点を指摘している。一つは、エージェントがタスク遂行時に人間との十分な対話を欠くこと。もう一つは、経験から学ぶ仕組みが不足していること。（なのでそのブログを読みに行った。）

後半戦 — 姚順雨

https://ysymyth.github.io/The-Second-Half/

前半では、新しい学習法やモデルを次々に出し、各種ベンチマークでスコアを伸ばし、さらに難しいデータセットを設計してまた伸ばす、という循環を続けてきた。最終的に汎化に効く一本の道として 強化学習 が見つかった。この「レシピ」はおおむね標準化され、ループを回し続ければ性能はまだ伸びる。だから評価の仕方そのものを根本から見直す必要がある。

問題は、AI がチェスや囲碁で世界チャンピオンに勝ち、SAT や司法試験で多数の人を上回り、競技で金メダル級でも、現実世界（少なくとも経済／GDP の視点）ではそれに見合う変化が起きていない、という点だ。著者はこれを utility（便益）問題 と呼ぶ。

過去のベンチマークと本番運用にはずれが多く、例を二つ挙げる。

ベンチはしばしば 完全自動 を仮定する：エージェントがタスクを受け取り自律実行し、報酬を得る。現実では 人と何度も行き来しながら 進むことが多い——カスタマーサポートに長文を一本投げて、十分待てば一発で全部片づく、とは期待できない。

ベンチはしばしば i.i.d. を仮定する：500 問を独立に解いて集計。現実のタスクは直列であることが多い——Google のエンジニアはコードベースに慣れるほど Google3 の問題が楽になるが、ソフトウェア工学エージェントが同一リポジトリで大量の問題を処理しても、同様に「慣れ」が現れないとは限らない。長期記憶が必要になるのは明らかで（先行研究が一部実現）、だが学界にはその必要性を検証するベンチも、機械学習の根拠である i.i.d. 仮定に挑む胆力も、まだ不足している。

AI 開発の前半では、これらの仮定でベンチを回すのに足りた。「汎用手法」がその仮定のもとで安定して効くようになった今、後半戦の鍵は次のようなことだ。

実運用に即した新しい評価設定やタスクを設計する

定めた方針で問題を解くか、新要素で手法を改善し、再び循環させる

前半は漸進的な手法とモデルの積み重ねだった。後半では、ある程度それらがふるいにかけられる——常識外れの新しい前提を置けない限り、汎用解法が漸進的小改修を完全に凌駕し、そのとき初めて真に破壊的な研究の余地が開く。

文中の一節が特に秀逸だと感じた。

思考（推論）は奇妙な行為である——外部世界を直接は変えないが、推論空間は開いて組合せ爆発する：一語、一文、一節、あるいは一万個のランダムな英単語を考えても、周囲はすぐには変わらない。古典的 RL にとってこれは極めて悪い取引で、意思決定をほぼ不可能にする。100 万入りの箱と空箱を二つ選べと言われたとき期待値は 50 万だが、空箱を無限に足すと期待値は 0 になる。ところが推論を任意の RL 環境の行動空間に入れると、言語の事前学習による事前分布で汎化し、異なる決定に柔軟なテスト時計算を割り当てられる。これは不思議なことで、ここでは説明しきれない；別稿かもしれない。ReAct を読むと推論エージェントの原話がわかる。直観的には：空箱を無限に足しても、人生のいろいろなゲームでそれらを「見た」経験が、具体的なゲームで金の入った箱を選ぶのを助ける。抽象化すれば：言語はエージェント内の推論を通じて汎化する。

第1節：エージェントと環境のリアルタイム対話

音声エージェントのリアルタイム難題

根本矛盾：直列処理 vs リアルタイム要件

待つ必要がある：聞き終わる → 考える → 考え終わって初めて話せる。

ブロッキング待ち：各段がボトルネックになりうる

- ユーザー発話終了（VAD）→ 音声認識（ASR）→ 完全な文

- 完全な文 → LLM 思考 → 思考完了まで出力なし

- 思考完了 → 文分割 → 音声合成（TTS）→ 音声応答

遅延の累積が人間の許容を大きく超える。

速さと遅さのジレンマ

返すのが速いと誤りやすく、遅いとユーザーの忍耐を削る。聞きながら先読みし、聞きながら熟考するのも難しい。

技術的ボトルネック

知覚段階

音声：一文が終わるまで待つと遅延が大きい；断片をそのまま ASR に入れると認識率が落ちる。

視覚：2K トークン級スクリーンショットの prefill が重い。

思考段階

完全な入力がないと思考を始めにくい。

ユーザ意図の先読みが難しい。

Test-time scaling が遅延をさらに増幅する。

実行段階

「考え終わる」まで行動できない。

GUI 操作はしばしば毎ステップスクリーンショットを取り直して再判断する。

アーキテクチャの革新：SEAL（Streaming, Event-driven Agent Loop）

核心は、対話を非同期イベント流として抽象化し、低遅延で割り込み可能なリアルタイム対話を実現すること。

1. 知覚層：連続した現実信号（音声、GUI 動画）を離散イベント列にする。

2. 思考層：非同期イベント処理——聞きながら考え、考えながら話し、「思考と行動」が交錯する。

3. 実行層：離散の行動指令を連続信号（TTS 波形、マウス軌跡など）に戻す。

第1層：知覚層

入力：順序信号——音声ストリーム、GUI 動画ストリーム。出力：speech_start、interrupt、笑い声、音声断片、ui_change など。

従来の VAD+ASR の代わりにストリーミング音声知覚モデル。オープンな自回帰 LLM ベースのストリーミング音声知覚：

Whisper 型 ASR とは異なり、自回帰は認識遅延の低減に寄与する。

- 入力音声トークンをストリーム処理

- テキストと音響イベントをストリーム出力

オープン LLM の後学習

- 対話コンテキストを保持し in-context learning 可能で、ユーザー固有情報やドメイン語の認識が大きく改善しうる。

- 世界知識・常識により、ブランド名や金額などの認識率が上がりうる。

出力はテキストだけでなく音響イベントも含む。

リアルタイムの書き起こし断片；音響イベント用の特殊トークン例：

第2層：思考層

イベント駆動ループに基づく：割り込み可能で非同期——聞きながら考え、考えながら話す。入力：イベントキューからの離散イベント流。出力：交錯する思考と行動指令。

中核の革新：対話型 ReAct

従来の ReAct：

対話型 ReAct：

対話型 ReAct：聞きながら考える

従来の ReAct：いったん割り込まれると、それまでの思考はすべて無効になり最初から。

対話型 ReAct：割り込み前の推論を保持し、新しいユーザー入力を足したうえで、元のコンテキスト上で思考を続ける。

対話型 ReAct：考えながら話す

「前置き」などで深い思考の時間を稼ぎ、初発話までの遅延を下げる。

第3層：実行層

離散の行動指令を連続した現実信号に写像する。

入力：speak(…)、click(…) など。出力：順序信号（音声波形、マウス軌跡など）。

GUI 操作の「ラストワンマイル」

エージェントが座標を直接出すのは難しい。ロボット分野の VLA を参考に、RL 後学習でモデルが行動を直接出す。

案1：主モデルがマウスクリック座標を直接出力。

案2：人間のマウス軌跡を模した VLA を別途学習し、「移動—微調整—クリック」の閉ループ。

音声合成も人間らしく：まず注釈付きテキストを生成し、それを TTS で音にする。

エージェントが経験から学ぶ

パラダイム1：Post-Training

方法：パラメータ更新（後学習）

勾配で重みを更新

大量のアノテーション付きデータが必要

学習後はモデルが固定

学習は遅く高コスト

パラダイム2：In-context Learning

方法：コンテキスト内学習

注意機構による暗黙の学習

長いコンテキストを「一時記憶」として使う

効果は多くの場合セッション内にとどまり、永続化しにくい

パラダイム3：外部化された学習

方法：知識と手順を外に出す

RAG：効率的で信頼性が高く、幻覚を抑える知識注入

Tool-generation：手順をコード化し自己進化

パラメトリック記憶の限界を突破

実践：Contextual Embeddings + Contextual BM25 + Reranking + Top-20 chunks Fine-tuning vs RAG（経験則）

論文 Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs

https://aclanthology.org/2024.emnlp-main.15.pdf

要点：RAG の方がしばしば有効で、微調整に伴う忘却や幻覚リスクを避けられる。

Tool Generation — エージェントの自己進化を支える https://arxiv.org/abs/2505.20286 最小プリセット原則

極小アーキテクチャ：少数の中核能力（例：Web プロキシ）だけ残す

過剰設計を避ける：複雑なツールチェーンやワークフローを事前に仮定しない

汎用を優先：ドメインのハードコードを減らす

最大自己進化メカニズム

中核能力：

1. ツールの自作：タスクに応じて新ツールを生成

2. 能力強化：既存ツールを反復改善

3. 経験の再利用：成功パターンを再利用可能な部品に固定

MCP-Zero と能動的ツール発見

従来のジレンマ：

全量注入：ツール一式がトークンを圧迫 → コンテキスト爆発

静的検索：初期クエリだけでツールを選び、タスクの変化（例：デバッグでファイルシステム＋コード分析＋コマンド実行が必要）を予測できない

MCP-Zero：受動から能動へ

核心：エージェントに能力の欠落を能動的に見つけ、必要に応じてツールを申請させる

1. 能動的ツール要求：エージェントが構造化されたニーズを生成

2. 階層的セマンティックルーティング：まずサーバを絞り、次にツールをマッチ

3. 反復的な能力拡張：実行中に動的に発見しツールチェーンを組み立てる

学習を外に出し、注意ウィンドウの制約を超えるのは必然の流れ。

七十年の AI 研究史で最大の教訓のひとつは、計算をうまく使う汎用手法が最終的にいちばん効き、しかも差が大きい、ということかもしれない。

2025年バークシャー株主総会メモ

2025-05-05T00:00:00.000Z

2025年バークシャー株主総会メモ

ニュージャージーから来ました。今日ここで質問の機会をいただけて本当に良かったです。投資の原則や忍耐の大切さをよくお話しされますが、もう一度ヒントをいただけますか。

チャンスは瞬く間に過ぎるので、ときには即断が必要だ。1966年、ある電話があった——詳細は控えるが——ある女性が夫の会社を 600 万ドルで売りたいと言ってきた。200 万ドルの資産と 900 件以上の事業が含まれ、税引前利益は年 200 万ドルになる見込みだった。かなり魅力的な価格に聞こえた。

チャーリーとすぐ話し合った。チャーリーはその女性を知らなかったが、彼女の共同経営者 Ben Rosser については知っていた。売り手は裕福な未亡人か、あるいは夫が何らかの理由で急いで手放したいのかもしれないと推測した。12 月 31 日まで帳簿を調べ、なぜ売るのか理解しようとしていた。

翌朝、Will Phillips から電話があった。東海岸の人は中西部の人に偏見を持つことがある。もしその女性がアイオワ出身なら、東部の人とは振る舞いが違うかもしれない。年率 33% も見込める取引の前では、忍耐を保つのは本当に難しい。

それで分かったのは、本当に良い機会が来たら、待つ必要はないということだ。合理的で利益の見込めるチャンスが現れたら、断固として動け。忍耐も大切だが、それ以上に機会を見抜く鋭さと実行する決断が重要だ。もちろん、市場のチャンスは永遠に誰かを待ってはくれない。

忍耐は確かに大切な資質だ。でもそれ以上に、チャンスが来たときに即断できるかだ。突然目の前に現れることがある——5 秒の電話かもしれない——その場で取るに値するかすぐ判断しなければならない。ビジネス判断でいちばん避けるべきは自分を疑いすぎることだ。多くの場合、ためらうからチャンスを逃す。だから商売はこんなに面白く、僕にとって最大の喜びなのだ。

90 代に入り、富も普通の人をはるかに超えているが、それでも毎朝オフィスに来るのが待ち遠しい。単なる仕事ではなく、人の役に立ち、価値を生む喜びの源泉だ。その熱意は受け継がせたい。子どもたちにもその喜びを味わってほしい。

チャーリーと 60 年以上築いてきたパートナーシップのように、いつも志を同じくする人と働いてきた。その協力の形は一度も裏切らなかったし、新しい仲間を探す基準にもなっている。だから今日ここにいる取締役やチームがこんなに息が合う。チャンスが本当に良いと確信したら、もうためらうな——すぐ動け。

カリフォルニアから来ました。こんな総会を準備してくださりありがとうございます。ジョブズ以外にあのような会社を創れる人はいないとおっしゃいましたが、ティム・クックは素晴らしい仕事をしています。ウォーレン、あなたはバークシャーを創り上げた方で、グレッグ・アーベルはその中でも意外な人材だとおっしゃいました。でもご本人はごく普通の方に見えます——普通と言うのは褒め言葉として——なぜ今後数十年、グレッグ・アーベルが最高の後継者だと思われるのか教えてください。

とても重要な質問だ。僕たちの業界で優れた投資チームを組むのは容易ではない。アメリカのような広い市場では、資本運用にふさわしい土壌を育てるには長い時間がかかる。特に資本配分ではそうだ。時間の蓄積が要るし、互いに信頼し合える志を同じくする仲間を見つける必要がある。何年も、投資判断には慎重に向き合い、リスクを丁寧に評価してきた。

昨日、会社の展示ブースを見に行った。情熱あふれる社員の印象が強く残った。見返りを求めず、ただ仕事を愛している。その姿勢は尊敬に値する。自分が愛する仕事を選ぶことは極めて重要だ。キャリアで五人のボスに会ったが、それぞれから大きく学んだ。最終的に起業を選んだのは、好きなことをするのが最高の働き方だからだ。

誰も僕のように恵まれているわけではない。七、八歳で生涯の情熱を見つけられるとは限らない。有名な指揮者グレン・ミラーの話のように、楽団は最初は無名で、1941年になって独特のスタイルで一気に名を上げた。若いうちに本当に愛せる仕事を見つけられたなら、初任給の高低はあまり気にしなくていい。ただし正しい会社とボスを選べ。やるに値しない仕事もある。

僕たちは偉大な国に、最高の時代に生きている。だからバトンをグレッグ・アーベルに渡す決断をした。ただしバークシャーのような企業を築くのは一朝一夕ではない。財務の世界にはこういう言葉がある。「一度豊かになれば十分。不必要なリスクを冒す必要はない。」市場には常に、借金やレバレッジで儲け、最後に誰かが引き受けてくれることを当てにする人がいる。覚えておいてほしい——そうした投機はいつか代償を払う。

人生をやり直せるわけではないが、やり直せるなら、それでも好きなことを選ぶだろう。今に至るまで、僕にとって実に素晴らしい旅だった。

先ほどの質問への補足だが、適切なチャンスにまだ出会えなくても、過度に焦る必要はない。人生には適切なタイミングがあり、本当に合う人にも出会える。生涯の伴侶を探すようなもので、一目惚れすることもある。一人を逃しても、もう適切な人に会えないわけではない。待つ価値のある人や出来事は、最もふさわしい瞬間に現れることが多い。

メリーランドから来ました。今日お時間をいただきありがとうございます。若者で投資に興味があります。あなたが若い頃に学んだ教訓は何でしょうか。自分なりの投資哲学を育てたいのですが、アドバイスをお願いします。

とても良い質問だ。若い頃に誰かこんなアドバイスをくれればよかった。本質はどんな人と組むかだ。毎回完璧な決断を期待してはいけない。人生が特定の方向に進むなら、尊敬できる人を仲間にしろ。ここ数年組んできた友人たちのように——規模はバークシャーほどではないが——志を同じくする者と進むのが賢明だ。残念ながらこうした道理は、人生の後半になってようやく腹に落ちることが多い。

富豪の成功パターンを盲信するより、心から尊敬できる賢者を探せ。僕自身もそうしてきた。優れた人から学び、実践の中で成長する。すでに意味のある仕事を見つけ、切迫した金銭的プレッシャーがないなら、チャーリー・マンガーのように賢者と時間を過ごせ。僕の言う人たちは職分を超えて価値を生み出している。そうした仲間を見つけ成功を分かち合えるのは大きな幸運だ。すぐに見つからなくても諦めるな。努力を続ければ、いつか志を同じくする人に出会える。

GEICO に就職面接に行ったとき、閉ざされたドアの向こうに誰がいるかまったく分からなかった。でも十分後、人生を変えてくれる人に出会った。自分を助けてくれた人を忘れるな。行動で報いろ。もちろん、うまくいかないこともある。恵まれた環境にいるなら、それを大切にしろ。アメリカで生まれただけで世界の大多数より恵まれている——世界 80 億人のうちアメリカ人は 3 億強だ。それ自体がアドバンテージだ。ただし、自分の原則に背いて他人に迎合してはいけない。

投資は僕にとって楽しみに満ちている。多くの人は金を稼いだら業界を去るが、本当に探すべきは生涯愛せる仕事だ。トム・マーフィーのように人の可能性を見抜く人は稀だ——彼は 98 歳まで、人の潜在能力を見抜く鋭さを保っていた。より良い自分になるには、そうしたメンターを探せ。バークシャーの成功もそこにある。1963年から組んできた Sandy Gottesman、30 年以上の Walter Scott、そして 25 年になるグレッグ・アーベル……こうした人たちと進む道は、いつも正しい。

面白いことに、そうすると長生きもするらしい。僕も仲間たちも妙に長寿だ——コーラをよく飲むから（笑）というより、みんな愛することをしているからかもしれない。幸せな人は長生きしやすい。それが僕の実感だ。

バークシャーの皆様、アジット・ジェイン、グレッグ・アーベル、ピーター・チェンと申します。上海から来ました。バークシャーの株主総会は初めてです。人生にも上り坂と下り坂があると思いますが、あなたにも最低点はありましたか。最低点をどう乗り越え、難関を突破しましたか。

誰の人生にも高揚と低落があり、それは普通のことだ。質問ありがとう。僕にとっては取るに足りない話かもしれない。チャーリーを例に取っても、彼も多くの苦しい瞬間を経験した。それが人生の一部だ——誰も永遠に順風満帆ではいられない。

最高の助言をするとは言わないが、低潮は一生のうち何度も訪れる。あなたにとって特に重く感じる谷もあるだろう。でも挫折が世界の終わりではないと信じてほしい。保証するが、谷を経験してもあなたは倒れない。困境に直面すると軽んじられたり笑われたりすることもあるが、本当に偉大な人は運が一時的に悪くても、好転が来ると信じ続ける。だから運は単なる運ではないと考えるな。

健康の問題のような低谷にいるなら、言葉にしにくい。でも覚えておいてほしい。僕たちは素晴らしい時代に生きている。百年前、五百年前、もっと荒れた時代に生まれていたら、運命はまったく違っていたかもしれない。比べれば僕たちの世代はすでに恵まれている。二十数世代の努力で、文明はかつてない高みに来ている。二十年前は個人の手の届かないことが多かったが、今日では挑戦により賢く対応できる。

人生の中の良いものに意識を向けることを勧める。悪いことは必ず起きる。避けられない。それでも困難な時期に、良い人生は依然として築ける。それが僕の考えだ。

個人的には 94 年の人生で、本当にひどい目にあったことはない。多くの友人もそうだ。コーラが飲みたければ飲む。やりたいことをやる。少なくとも今のところ、なんとかうまくいっている。

例をもう一つ。プロアメフト選手のピークは 30 代か 40 代までかもしれないが、彼らはそのライフサイクルに慣れている。同様に、ある業界を選ぶなら、最初からその法則を理解しておけ。野球選手も同じで、ポジションごとに特有の難しさがある。

チャーリーとよく話すが、人体には過度の運動は必要ない。健康には気を遣うが、自分を消耗しすぎない。アスリートの例は、前向きな側面に目を向けることのほうが大事だと伝えたかった。寿命を延ばしたいなら、十分恵まれている（あなたのように遠路はるばる来て、こんなに多くの賢く面白い人と学べるエネルギーがあるなら、過去数百年・数千年の大多数より恵まれている）。それが伝えたかったことだ。

バークシャーのウォーレン・バフェット様、ポーランド出身でシカゴに住むアリサと申します。74 年前の寒い 1 月のあなたの話にずっと励まされてきました——1951年のある土曜、保険を学ぶためにニューヨークから 8 時間かけてワシントンに列車で向かい、着いてみればコートのオフィスは閉まっていた、という話です。その執念が僕を導いてくれました。2011年、15 歳のとき同じ決意で手紙を出し、面会をお願いしました。お返事では残り時間は 3000 日ほどだと。今は 5000 日以上経ち、1951年から変わらぬ情熱に励まされ続けています。今日、もう一度お願いします。四分の一の時間でも——オフィスで一時間でも。スケジュールはお忙しいでしょう。ポーランドで苦難を生き延びた身として、交友は慎重ですが誠実です。お断りしないでください——今この場に四万人が僕の後ろに立ち、この敬意は正々堂々としたものです。重ねてお願いします。人生の一時間でも分けていただけますか。貴重なお時間に感謝します。

素晴らしい！少し待って——実は僕の経歴を詳しく説明しなくて大丈夫だ。自分の物語はよく知っている。この四万人の前でこんな面白い質問をしてくれてありがとう。若い頃の経験を一つ話そう。

創業初期は、よく一人で州をまたいで各社を訪ねた。まだ若く、IR 部門もない時代で、だいたい CEO が直接応対してくれた。門前払いを恐れたが、やがて方法を見つけた。面会を頼むとき「10 分だけで十分」とはっきり言う——相手が延長を求めない限り。その時間の主導権は自分が握る。

70 年前の石炭業界の名問いを思い出す。「無人島に十年閉じ込められるなら、どの競合の株を持つ？」経営者は競合の話に熱を上げる。子どもがおもちゃを比べるように。でも僕は会話の焦点を導くことを学んだ——競合ばかりでなく、自社の核となる強みを語ってもらうことだ。

今は企業構造が複雑で、部門は独立したパズルのようだ。IR は株を買うメリットを強調し、その機能は肥大化している。大切なのは、自分の頭で企業を理解することだ。バークシャーにも独特の経営哲学がある。研究用の資料は十分出すが、四万人全員の面接要請にはとても応じられない。

あなたの執念には心から敬意を表するが、はっきり言わせてほしい。ここが僕たちにできる限界だ。努力は称賛に値するが、ルールは全員に公平でなければならない。

ドキュメンタリー『キャサリン・グラハムになる』の視聴をおすすめします。

2017年のバークシャー株主総会で、大型テック企業の投資価値について議論しました。今ではマイクロソフト、アップル、アマゾンなどは外部資金を必要としない段階に達し、潤沢な自己資金を持ち、大量のリソースを人工知能の発展に投じています。過去と比べ、こうした巨大テック企業の貸借対照表の構造や資産配分戦略について見方は変わりましたか。特に現在の豊富な現金保有と、AI への大規模投資シフトを踏まえて。

その通りだ。こうした企業が豊かな利益を上げられるのは、大量の資本を投下しているからだ。どんな商売にも資本投入は要る。コカ・コーラを例に取れば、瓶詰め事業は設備に巨額の先行投資が必要だが、稼働に乗れば追加資本は比較的少なく、高いリターンが得られる。販売チャネルに要する資本はさらに限定的だ。このモデルは優れており、長く続く。

資本運用の観点では保険は特殊だ。損害保険には十分な担保資金が要るが、保険料を投資に回せる。こうした資本集約型の事業は、管理が良ければ極めて高いリターンをもたらす。アップルは別の典型——ほとんど追加調達を必要とせず、継続的に自社株買いができる。株価は波があるが、ビジネスモデルは堅牢だ。

投資の世界では、資本管理で巨万の富を築いた人が多い。秘訣は他人の資金を巧みに使い、管理報酬を取ることだ。成績が悪くてもかなりの収入があり、優秀ならさらに資金が集まる。資本市場の仕組みだ。過度に非難する必要はない。

チャーリーと僕は長年考え、最終的にこのモデルを選んだ。投資家の資金でリターンを生み、リスクも分かち合う。理想的なビジネスモデルの一つだ。もちろん濫用の余地もあり、米国やカナダでも例は見てきた。

フロリダから来ました。13 歳で、兄は 15 歳です。父と一緒に来ました。総会を開いてくださりありがとうございます。初めて参加します。高校の授業のうち、将来すごい投資家になるのに効く科目は何でしょうか。もう少し詳しく教えてください。

人生で出会う先生が、いちばん深い影響を与えることが多い。僕は幸運だった。学校だけでなく、雇い主や先輩からも多くを学んだ。父が最初の投資のメンターだった——投資業にいたので、毎週土曜にどう商売をするか観察できた。他の子がほとんど触れない投資の本も大量に読んだ。

オマハ公共図書館で偶然 19 世紀の投資書を見つけ、ニューヨークではさらに貴重な本にも当たった。読書は好きだが、チャーリー・マンガーほどではない。「誰とランチしたいか」と聞かれたら、答えはいつもチャーリーだ。歩く図書館のようで、本から真知を引き出してくる。好奇心を保ち、志を同じくする先生を見つけることが大切だ。

三つの学校に通い、最後はワシントン大学に進んだ。どこでも二、三人、深く学べる先生に出会った。知識だけでなく、特別な配慮と指導をしてくれた。ベンジャミン・グラハム教授は父のように教えてくれた。『The Great Bridge』は重要な人生の示唆をくれた。

父はよく言っていた。一人ひとり違う。今は迷っていても、やがて自分に合う道が見つかる。学校では、話し方も教え方も心地よい先生に出会う——コロンビア大学ではグラハム教授が父のような温かさをくれた。

振り返れば、少なくとも十人のメンターが人生を変えた。共通点は、若者のために余分な時間を惜しまなかったことだ。質の高い学びは、学校そのものより、こうした個人的な師弟関係から来る。これは当初話したかったことの範囲を超えてしまった。

他言語

中文

English

zwy-ja

2025-04-13T00:00:00.000Z

張維迎：夜が暗いうちに出発すれば、歩けば歩くほど空が明るくなり、誰もが自信を持てる（転載）

WeChat のお気に入りを眺めていたらこの記事が出てきた。開いてみるとすでに公式アカウント側で削除されていたので、原文を探して自分のブログに転載した。学習用であり、自分用である。

初出：WeChat 公式アカウント「WSJ 中文」

長いあいだ、張維迎は少し孤独を感じていた。時代の思潮が激しく変わるなか、何十年も守ってきた考えに応える声は少なく、彼は揺らがなかったが、残念だと感じていた。ここ数年、若者の立場が少しずつ自分に近づき始めたのを微かに感じ取り、「とてもうれしい」と語る。

北京大学光華管理学院の院長を退いてからすでに十三年。周囲の論争はずいぶん減った。かえって考えを整理する時間が増え、これまでの見解を改訂し、さらに深めてきた。

「企業家精神」と「市場経済」が張維迎の思想を理解するキーワードだ。今の彼から見れば、市場経済は人を一気に大富豪にするものではなく、普通の人が「それなりに暮らせる可能性」を持てる仕組みにすぎない。それでもそれは貴重だと彼は言う。

張維迎はますます、市場経済の本当の意味は、最も創造力があり野心ある人々に「人類のための良いことしかできず、悪いことができない」ようにすることだと感じている。経済学の根本である合理人仮説の対極に立ち、「私は人間性に失望している」と言う。市場経済は、彼にとって人間性を抑えるメカニズムだ。「自分では自分を律することができないなら、市場経済に任せよう。」

市場経済の論理では、適切な人が最もふさわしい位置に置かれるべきであり、その過程で企業家が最も重要な役割を果たす。「今の成果は誰の目にも明らかに改革開放から来ており、そのなかで企業家は重要な役割を果たした」と張維迎は言う。新しいデジタル産業、インターネット、電子商取引から製造業まで、民営企業の功績は大きい。「国際市場にあれほど多くの低コスト製品を輸出できたのは、実はすべて企業家の努力の結果だ。」

市場経済は空気のようなものだと彼は考える。普通は誰も意識しない。「いつもそこにある」。誰もが当たり前で、大したことないと思う。しかしなくなった瞬間に、その大切さ、なくてはならないこと、生命体が生き延びるにはそれが要る、と気づく。

張維迎は中国北西部の山あい——陝西省呉堡県辛荘村に生まれた。それを恥じたことはなく、劣等感もなかった。むしろ財産だとさえ思っている。本当の農民の息子であり、例を挙げるときは『平凡の世界』か、家庭連産請負責任制の話になる。「『平凡の世界』はうちの地方の話で、舞台は実家から近い。」

この例を挙げたのは、作品の一場面からだ。双水村の書記田福堂の仕事は、毎朝鈴を鳴らして村人を労働に呼ぶことだった。ある日もいつものように鈴を鳴らしたが、動きがない。鈴の音だけが野に響いている。よく見ると、みんなはとっくに出かけていた。田福堂は腑に落ちない。なぜもう人を呼ばなくてもよくなったのか。昔はそれが容易ではなかった。物語は家庭連産請負責任制の導入後で、農民は労働から自分の取り分を得られ、大鍋飯ではなく多労多得となり、村人の積極性が明らかに高まった。

張維迎はこの例で、体制・メカニズムの革新が経済の運行にいかに重要かを示した。「家庭連産請負責任制がなければ、田福堂が鈴を振るだけでは、本当の積極性を持てる人は少ない。」これが経済の道理だと彼は言う。多くの人の理解では、需要は通貨で創出でき、信頼は形作れ、経済は刺激できる。張維迎にとって経済発展は本来自然な過程だ。「夜が暗いうちに出発すれば、歩けば歩くほど空が明るくなり、誰もが自信を持てる。」

張維迎は経済学者のなかでは異色で、公衆に向けて発言することに熱心であり、学術研究も怠らない。どちらも同じくらい大切で、どちらも捨てたくない。近著に『企業家精神を再理解する』と『回望』がある。前者には近年の企業家精神についての思考をまとめ、後者では筆致を変え、成長のなかで大切だった人々——父母、教師、幼なじみ——について書き、感情がすらすらと流れ出る。

文字と同様、話していても中国の著名経済学者という感じはしない。飾り気がなく、いつも笑顔で、声も穏やか。画面の向こうでは定刻どおり笑顔で現れ、ダウンベストを着ていた。北京に住み働いて久しいが、訛りは変わらず、北西部の出身だとすぐ分かる。

前回、公の場に不意に立ったのは『信天游』の一曲がきっかけだった。運命を変えてくれた恩師何煉成が他界し、パンデミック下で都市間移動が難しく、最後の見送りができなかった。彼は『何先生、もう一曲信天游を聴いてください』という文章を書き、歌詞を添えた。

歌詞にはこうある。「初めて会った日、そっと頭を撫でてくれた。最後に会った日、微笑んで口を開かなかった。喜んでくれたことも、憂いてくれたこともあった。私の信天游を褒めてくれたこともあった。」

1977 年に高考が再開される前、高校卒業後の張維迎は村に戻り、団支部書記と民兵連副指導員を務め、文科と理科の区別さえ知らなかった。最終的に西北大学の新設政治経済学专业に合格した。何煉成がその専攻の責任者で、その年専攻は新設、定員 50 人。張維迎は増員枠で大学の門をくぐり、運命を変えた。家を離れ大学へ行く日、村人全員が見送り、家族は皆に米糕と煮込みを振る舞った。

「何先生が増員を主導してくれなければ、大学にも行けなかったかもしれない。」張維迎は何煉成の助力を今も忘れない。当時西北大学は何の主導で経済学専攻を新設し、50 人の受験生が運命を変える機会を得た。

後に北京大学の教師になっても、何煉成とは連絡を保ち、機会があれば会いに行った。「経済学の基礎は何先生が築いてくれた。」1951 年卒業後すぐ西北大学にいた何煉成は、さまざまな事情で長くまともに学生を持てず、高考再開後、張維迎らが初めての教え子となり、何にとっては我が子同然だった。

張維迎が北大光華管理学院院長に就任後、一連の改革を試み、多くの抵抗に遭った。何煉成は聞きつけ、当時の北大学長に手紙を書いた。学長とは面識がなかったが、湖南同郷だから試してみたいと思ったという。

何先生の死後、張維迎は歌詞の一節を書き、同郷ですでに名を馳せていた信天游の歌手丁文軍に曲と歌唱を依頼した。録り終えて丁文軍から送られてきた音源に、満足なら本格的なスタジオで録ろうと言われ、画像を何枚か添えて動画にし、後輩の公式アカウントで公開した。思いがけず話題になり、張維迎本人が歌ったと思われた。彼は慌てて否定し、動画末尾に歌っているのは自分ではないと書いてあるが、みんな見ていないのだと言った。

『回望』は創作というより、恩義のある人や記憶に深い人について書いたもので、せいぜい感情の吐露だ。「書こうと思って書いたのではなく、書かなければならないものがあった。頭に入りきらなくなった。」

張維迎は頑なで、やや型破りだ。多くの学者と違い、派閥を作らず、誰にも依存せず、言うことはすべて自分が信じることだ。何煉成の影響は大きいが、学派を組むことはせず、そうしたくない。今は世間の目もあまり気にせず、自分自身が自分の行いに満足できるかだけを気にしている。

60 歳を過ぎ、50 歳のとき突然「天命を知った」感覚があり、自分が何十年何をしてきて、これから何をすべきかはっきりした、と自分に答えを出した。彼がこの年月やってきたことは、公衆の観念を変えようとすることだ。実際大量の仕事をしてきたが、「以前は自覚がなかった」。今は少なくとも飾らないこと、すでに功成名遂げたからといって取り繕う姿勢は要らない、と考えている。

そう見ると、張維迎はますます自由になっている。

以下、張維迎との対話である。

『WSJ.』：「合理人」は古典経済学の前提だが、いわゆる合理人仮説をどう見るか。 張維迎： 理性にはいろいろな選び方があり、一つだけではない。また、どこまで先を見るかも違う。泥棒も合理的だし、企業家になるのも合理的だ。まったく別物だ。私は個人を批判しない。何をするも本人の選択だ。気になるのは、なぜそうするのか、その背後の理由だ。

本来、北大や清華の優秀な卒業生がみな商界へ向かうのは国の幸運だ。みな体制内へ頭を削って入ろうとするなら、国の不幸だ。

経済が活気に満ち、ますます多くの人が創造や起業を望むとき、機会は多い。今後数年、卒業生のことも心配だ。光華管理学院長のときから、学生の教育・進路・機会に注目していた。複数のオファーや仕事から選べるなら、うれしかった。

今は二人で一つのオファーも取れないと聞く。そういう状況が心配だ。企業家精神を持つ人が自由に起業できるときだけ、より多くの雇用が生まれる。市場は人により多くの選択肢を与え、気分がすっきりする。要因が多すぎると気分が悪くなり、気分が悪いと創造力は発揮しにくい。創造力は気分が晴れやかなときに最も高い。

『WSJ.』： 中国はすでに「ケーキを分ける」段階に入ったのか。ケーキは十分大きいのか。 張維迎： 経済学から言えば、本当に「分ける段階だけ」に達した国はない。私には分ける段階など存在しない。社会が常にケーキを大きくしようとするなら、ケーキを作ること自体が分ける過程だ。配分が不合理なら、ケーキは大きくならない。ケーキが大きくなるのは、比較的合理的に分かれているからだ。

改革開放の過程で私たちはみな恩恵を受けた。本当に解くべきは不合理で不公平な要因をどう取り除くかだ。例えば商いのなかで、本当に能力と努力で契約を取るのであって、コネで取るのであってはならない。コネ頼みなら配分は不合理だ。解くべきはそういう問題で、誰の手のケーキが大きいからといって奪うのではない。そうすれば将来のケーキはなくなる。今は取れても、未来は取れない。

また、富は変化することに注意が要る。大都市の高層ビルを見て大きな資産だと思うかもしれない。三年後には一銭にもならないかもしれない。デトロイトを見てほしい。大量の不動産が要らなくなり、ただでも誰も取らない。富は物質ではない。面積や重量ではなく、市場がその資産でいくら価値を創出できるかだ。価値を創出しなければ、意味がない。

今、ボーイング 747 をタダでくれるが離陸も機内レストランも禁止されるとしたら、その資産はプラスかマイナスか。明らかにマイナスだ。手入れしなければすぐ傷み、整備費もかかる。富は動きのなかで価値を創出するときに初めて富だ。創出できなければ富ではない。

高層ビルを見て「なぜ自分に分け前がない」と言う人がいる。分け与えられても、手元では富ではない。あなたの手では価値がないからだ。

『WSJ.』： パンデミック後の中国経済への見通しは。下向きの段階に入るのは運命づけられているか。 張維迎： 数十年の高成長のあと、速度は必ず下がる。公表データどおりの規模なら、安定して 3% を維持できればすでにすごい。これまでの発展モデルは、市場で検証済みの技術をベースにし、R&D 費をかけず投産すれば売れるから速かった。フロンティアに近づくほど自然に遅くなる。恥ずかしいことではない。悪いから遅いのではなく、うまくやっても遅くなる。

問題は、その下降した速度を維持できるかだ。3% を維持できると思うが、挑戦は多い。努力しなければマイナスもありうる。例は多い。かつてのアルゼンチンは先進国・豊かな国だった。ブラジル、ベネズエラもそうだ。

『WSJ.』： 経済刺激を繰り返し唱え、停滞への万能薬のようだが、この発想の問題は何か。 張維迎： 経済をどう刺激する？経済は内発的な衝動で発展する。金融政策で金利を下げ、補助を出すことはできる。しかし根本は解決しない。根本は衝動だ。経済発展は企業家に依るべきで、通貨を刷ることに依るべきではない。

経済問題を議論するとき、思考を縛る理論がある。形は完璧に見え、実は害が大きい。残念だ。経済はコントロールできると思う人が多い。ここで試し、あそこで試す。経済発展をキーボード操作のように考えるが、実際は人の内発的衝動だ。

『WSJ.』： 市場経済をどう理解するか。健全な社会でどんな役割を果たすべきか。資源配分という従来理解は更新すべきか。 張維迎： 私は人間性にそれほど楽観的ではない。だから人間性の悪い面を補い、人に誤りを正さざるを得ない体制が欲しい。今の市場経済観は多くの人とも、過去の自分とも違うかもしれない。昔は市場経済といえば資源配分と言ったが、それは間違いだ。本当の意味は、最も創造的で野心ある人が、人類のための善事しかできず、悪事ができないようにすることだ。

例：市場経済のなかでイーロン・マスクは善事しかできない。悪事はできない。なぜか。悪事をすれば顧客も投資家も受け入れず、終わりだ。火星に人を送ると言って、死んだら誰も申し込まない。自分では自分を律できない。頼れるのは体制で、それが市場経済だ。

『WSJ.』： 伝統的経済学者のレールから外れているように見える。なぜ公衆にもっと時間と精力を割くのか。 張維迎： どの学問も発達すれば分化し、専門化・技術化する。さまざまな方面に人がおり、みんなが興味を持つとは限らない。好みや性格、教育が違うのは当然だ。

真心で真剣にやるなら、みな評価に値する。同僚の高度に定量化された研究も良い。すべての学者に、社会へ即効の影響を求めるべきではない。

しかし誠実であれ。自分が信じることを言え。人の聞きたいことだけを言い、誰かに媚びるのは無責任だ。責任ある人間とは、そうだと思えばそう言い、そうでなければ言わない、ということだ。

知識人には、自分が正しいと思い、聞いてもらえないと権力で従わせたがる傾向がある。反対の見解は別の見解で示せるが、権力で押し通してはならない。力を使えば自由主義経済学の初衷から外れる。説得だけだ。聞かなくても仕方ないが、力には訴えない。

『WSJ.』： 資本批判はいったん退潮したように見える。世界経済の下振れのなかで 996 が一部の人に「福報」と言われるような転換をどう見るか。 張維迎： 繰り返し言っているが、社長は社員より苦労するのが普通で、勤務時間も長い。

以前のインタビューで、自ら工場を作った個人経営者が工場を売却し、新オーナーに工場管理を続けさせられた。記者が「売却後最大の感想は」と聞くと、「以前は月末になると給料の金を工面するのに悩んだ。今は月末が近づくほどうれしい。給料を受け取りに行く」と答えた。

雇用者と被雇用者の責任は非対称だが、多くの人は気づかない。以前は社長が搾取していると思う人もいた。近年は世論も少し変わり、倒産が増え、社員は仕事を失った。だから社長に辞めてほしくない、社長が辞めたら飯が食えない、となった。

『WSJ.』：「信心は金より大切」という。世界で経済が下振れ気味だが、信心や期待は今の経済発展で何を意味するか。信心はどう取り戻すか。 張維迎： 人は目の前の障害より、長い先の期待を心配することがある。例：100 里を歩く人が午後 5 時に出発すると、歩けば歩くほど怖くなる。なぜか。暗くなるから。

朝 5 時に出発すれば、まだ暗くても怖くない。明るくなるから。午後 5 時から歩けば暗くなり、信心は失われる。人は長い道を見る。目の前に障害があるかだけではない。

ミクロでは、信心に最も大事なのは何か。自律性だ。運命は自分が握る。方向を選び、選ぶ権利があり、結果は自分の行いで決まるなら、信心がある。

高考の例：良い大学に行けなくても誰のせいにもしない。それは運命を自分が握るに近い。試験後、大学に行けるかどうか、どこに行くかが点数ではなく、他人の好みやくじ引きで決まるなら、信心も努力も失われる。

真の信心は、運命を自分が握れるという感覚から来る。概率的に少なくとも「自分は変えられる」と思えなければ、努力の意味も信心もない。

企業家も同じ。冒険精神があり、必ず儲かると思う人はいない。儲かることへの信心はある。しかし成功や儲けが努力と大きく関係するなら、必死になる。

運命を握れるなら信心がある。失敗しないわけではない。失敗しても納得できる。失敗後も再挑戦する。最終的な成否が努力とほぼ無関係で他人に操られるなら、もう来ない。

『WSJ.』： 北大にいて光華院長を務めた。エリートの揺りかごだが、あなたからは強い「下層への配慮」を感じる。多くの学者にない。両方をどう両立したか。 張維迎： 人はそれぞれだ。性格と選択が違う。故意に「下層への配慮」をしようとしたわけではない。素朴な天性かもしれない。自分は自分だ。成長の各段階で出会う人は影響するが、最大は父母だ。

農村出身を恥じたことはない。むしろ感動だ。こんなに多くのことを経験した。書くことは真情だ。歴史と出自は自分の一部だ。大切にすべきだ。

人は素っ気ない方がよい。飾らない。自分は自分だ。飾ればバレる。みんな馬鹿ではない。人文配慮など、わざとではなく、もともとそうだ。

『WSJ.』： 若者は生活圧力が大きい。就職も一線都市の生活も。階層の上昇も難しい。北大のような学校は貧しい家庭の子には届かない。「寒門から貴子は出にくい」が現実のように見える。どう観察するか。 張維迎： まず、改革開放の数十年で階層移動は非常に大きかったと認識すべきだ。

一方、近年の固化は感じる。本当なら注視が要る。ただ私個人はそれほど悲観していない。

2021 年の通選授業で、三百人ほどのクラスに清華・人大の学生もいた。調査したところ、九割超が都市出身、一割未満が農村出身。深刻に聞こえるが、父母の出自を聞くと、八割超の学生の父母は農村出身だった。そこで『北大学生はどこから？農門の二段跳び』という文章を書いた。第一段階は農村から都市へ、第二段階は次世代が北大へ。数十年の中国の流動は大きい。農村から直接北大は依然難しい。農村の教育水準は都市に及ばない。しかし都市に入った農村出身の親は子の学習を厳しく見るので、次世代が北大清華に入る可能性は高い。調査はある程度代表的だが、この問題を軽視してはならない。

高考には問題が多いが、今の中国で最も公平なのは依然高考だ。私は北大に行けなかった。高考のとき北大は無理だと分かったが、後に北大の教師になれた。それも良かった。

有名企業家や富豪の多くは貧しい出自だ。調べたところ、馬化騰、馬雲もごく普通の出自で、多くの富豪は農民で大学の機会もなかった。

だから私は市場経済を支持する。真の市場経済は垂直流動をもたらし、創造力と企業家精神で市場で戦える。シュンペーターの言葉が好きだ。市場経済の富人クラブは高級ホテルのようにいつも満室だが、宿泊者の名前は変わり続ける。誰かが去り誰かが入る。この流動が社会の健康の重要な指標だ。

私の観察ではまだそれほど悲観していない。なぜ市場化改革を大切にするか。市場経済でなければ普通人は頭角を現す希望がない。市場経済でなければ希望がない。

『WSJ.』： 企業家精神はある意味輸入品か。中国に自発的企業家精神の素地はあるか。 張維迎： 我々のなかには常に落ち着かない人がいる。何かしたい。他人がしたがらないかできないことをしたい。衝動があり、リスクを取り、失敗も受け入れる。古今にいた。人類はアフリカから出たが、誰が出たか。企業家精神のある人だ。

一般に言う企業家精神は商業面が多い。商業は挑戦があり、素質要求も高い。中国の伝統では、そういう人は科挙制度に「矯正」されてきた。科挙はすべての誘惑を官場に集め、古代の企業家精神の人は官場へ行った。政府には優秀な人が集まった。能力ある人たちだ。

社会にとっては損失だ。政府は富を分配する機構で、創造する場所ではない。真に企業家精神がある人は企業でこそ価値を発揮する。これが古代中国と近代西洋の違いの一つだ。

英国の例：才能ある人々が国教会を認めず、清教徒などもいたが、商業衝動があり企業家になった。工商業に従事すると創造力がより発揮された。

中国二千年史の大きな変化は改革開放後、優秀な人が企業を始めたことだ。しかし文化はまだ脆弱で、完全には変わっていない。

1980 年代から私がやりたかったのは観念の変化だ。公衆の商業観、企業家観、私が言う観念の近代化——「十大観念転換」。

光華院長のとき、公務員試験を受ける学生は少なかった。今は争って公務員を目指す。優秀な人が富を分配するより、富を創造すべきだ。

Eino-learning-notes-1-ChatModel-ja

2025-04-11T00:00:00.000Z

Eino 学習メモ 1：ChatModel

ChatModel は、Eino フレームワークにおける対話型大規模言語モデルの抽象であり、OpenAI や Ollama など異なるモデルサービスとやり取りするための統一インターフェースを提供する。

このコンポーネントは次のような場面で効いてくる：

自然言語対話

テキスト生成・補完

ツール呼び出し用パラメータの生成

マルチモーダル（テキスト・画像・音声など）

コンポーネント定義

インターフェース定義

コード位置：eino/components/model/interface.go

``go


type ChatModel interface {
    Generate(ctx context.Context, input []schema.Message, opts ...Option) (schema.Message, error)
    Stream(ctx context.Context, input []schema.Message, opts ...Option) (schema.StreamReader[*schema.Message], error)
    BindTools(tools []*schema.ToolInfo) error
}


Generate メソッド
機能：モデル応答を一括生成
パラメータ：
  - ctx：リクエスト単位の情報や Callback Manager を運ぶコンテキスト
  - input：入力メッセージのスライス
  - opts：モデル挙動を調整する任意オプション
戻り値：

- *schema.Message：生成された応答メッセージ


  - error：生成中のエラー
Stream メソッド
機能：ストリーミングでモデル応答を生成
パラメータ：Generate と同じ
戻り値：

- schema.StreamReader[schema.Message]：応答ストリームのリーダー


  - error：生成中のエラー
BindTools メソッド
機能：モデルに利用可能なツールをバインド
パラメータ：
  - tools：ツール情報のスライス
戻り値：
  - error：バインド時のエラー
中核の位置づけ 対話モデルの中核抽象レイヤーで、二つの呼び出しモードをサポートする：
Generate：同期で全文応答（通常の対話向け）
Stream：ストリーム応答（長文生成・リアルタイム対話向け）
アーキテクチャ上の特徴

go
type ChatModel interface {
    // 同步生成（典型AI对话模式）
    Generate(ctx context.Context, input []schema.Message, opts ...Option) (schema.Message, error)
    // 流式处理（适合逐段输出场景）
    Stream(ctx context.Context, input []*schema.Message, opts ...Option) (
        schema.StreamReader[schema.Message], error)
    // 工具绑定机制（支持功能扩展）
    BindTools(tools []*schema.ToolInfo) error
}


設計上の要点：
マルチモデル対応：インターフェース抽象で OpenAI／MAAS など異なるエンジンを吸収

コンテキスト対応：context.Context でタイムアウトやトレースなど

拡張可能なパラメータ：...Option で実装ごとの設定を足せる

ツールの動的バインド：BindTools で実行時に機能拡張（Function Calling 等を想定）


実務上の示唆：

//go:generate で ChatModelMock を自動生成していることから：


インターフェース優先の設計
ユニットテストを書きやすい
依存注入しやすい（環境ごとのテスト）
注意点：

並行性：コメントで BindTools と Generate がアトミックでない旨が示されており、同期制御が必要になり得る

メッセージプロトコル：schema.Message に依存（プロトコル詳細は別途）

ストリームのライフサイクル：StreamReader は Close で資源解放


Message 構造体
コード位置：eino/schema/message.go

go
type Message struct {   
    // Role 表示消息的角色（system/user/assistant/tool）
    Role RoleType
    // Content 是消息的文本内容
    Content string
    // MultiContent 是多模态内容，支持文本、图片、音频等
    MultiContent []ChatMessagePart
    // Name 是消息的发送者名称
    Name string
    // ToolCalls 是 assistant 消息中的工具调用信息
    ToolCalls []ToolCall
    // ToolCallID 是 tool 消息的工具调用 ID
    ToolCallID string
    // ResponseMeta 包含响应的元信息
    ResponseMeta *ResponseMeta
    // Extra 用于存储额外信息
    Extra map[string]any
}


Message はモデル対話の基本単位で、次をサポートする：
複数ロール：system（システム）、user（ユーザー）、assistant（AI）、tool（ツール）
マルチモーダル：テキスト・画像・音声・動画・ファイル
ツール呼び出し：外部ツール／関数
メタ情報：終了理由、トークン使用量など
共通 Option
Model コンポーネントはモデル挙動を設定する共通 Option を提供する。
コード位置：eino/components/model/option.go

go
type Options struct {
    // Temperature 控制输出的随机性
    Temperature *float32
    // MaxTokens 控制生成的最大 token 数量
    MaxTokens *int
    // Model 指定使用的模型名称
    Model *string
    // TopP 控制输出的多样性
    TopP *float32
    // Stop 指定停止生成的条件
    Stop []string
}


Option の設定例：

go
// 设置温度
WithTemperature(temperature float32) Option
// 设置最大 token 数
WithMaxTokens(maxTokens int) Option
// 设置模型名称
WithModel(name string) Option
// 设置 top_p 值
WithTopP(topP float32) Option
// 设置停止词
WithStop(stop []string) Option


使い方
単体利用

go
import (
    "context"
    "fmt"
    "io"
    "github.com/cloudwego/eino-ext/components/model/openai"
    "github.com/cloudwego/eino/components/model"
    "github.com/cloudwego/eino/schema"
)
// 初始化模型 (以openai为例)
cm, err := openai.NewChatModel(ctx, &openai.ChatModelConfig{
    // 配置参数
})
// 准备输入消息
messages := []*schema.Message{
    {
       Role:    schema.System,
       Content: "你是一个有帮助的助手。",
    },
    {
       Role:    schema.User,
       Content: "你好！",
    },
}
// 生成响应
response, err := cm.Generate(ctx, messages, model.WithTemperature(0.8))
// 响应处理
fmt.Print(response.Content)
// 流式生成
streamResult, err := cm.Stream(ctx, messages)
defer streamResult.Close()
for {
    chunk, err := streamResult.Recv()
    if err == io.EOF {
       break
    }
    if err != nil {
       // 错误处理
    }
    // 响应片段处理
    fmt.Print(chunk.Content)
}


オーケストレーションでの利用

go
import (
    "github.com/cloudwego/eino/schema"
    "github.com/cloudwego/eino/compose"
)
/* 初始化ChatModel
* cm, err := xxx
*/
// 在 Chain 中使用
c := compose.NewChain[[]schema.Message, schema.Message]()
c.AppendChatModel(cm)
// 在 Graph 中使用
g := compose.NewGraph[[]schema.Message, schema.Message]()
g.AddChatModelNode("model_node", cm)


Option と Callback
Option の例

go
import "github.com/cloudwego/eino/components/model"
// 使用 Option
response, err := cm.Generate(ctx, messages,
    model.WithTemperature(0.7),
    model.WithMaxTokens(2000),
    model.WithModel("gpt-4"),
)


Callback の例

go
import (
    "context"
    "fmt"
    "github.com/cloudwego/eino/callbacks"
    "github.com/cloudwego/eino/components/model"
    "github.com/cloudwego/eino/compose"
    "github.com/cloudwego/eino/schema"
    callbacksHelper "github.com/cloudwego/eino/utils/callbacks"
)
// 创建 callback handler
handler := &callbacksHelper.ModelCallbackHandler{
    OnStart: func(ctx context.Context, info callbacks.RunInfo, input model.CallbackInput) context.Context {
       fmt.Printf("开始生成，输入消息数量: %d\n", len(input.Messages))
       return ctx
    },
    OnEnd: func(ctx context.Context, info callbacks.RunInfo, output model.CallbackOutput) context.Context {
       fmt.Printf("生成完成，Token 使用情况: %+v\n", output.TokenUsage)
       return ctx
    },
    OnEndWithStreamOutput: func(ctx context.Context, info callbacks.RunInfo, output schema.StreamReader[*model.CallbackOutput]) context.Context {
       fmt.Println("开始接收流式输出")
       defer output.Close()
       return ctx
    },
}
// 使用 callback handler
helper := callbacksHelper.NewHandlerHelper().
    ChatModel(handler).
    Handler()
/* compose a chain
* chain := NewChain
* chain.appendxxx().
*       appendxxx().
*       ...
*/
// 在运行时使用
runnable, err := chain.Compile()
if err != nil {
    return err
}
result, err := runnable.Invoke(ctx, messages, compose.WithCallbacks(helper))


既存実装
1. OpenAI ChatModel：GPT 系 ChatModel - OpenAI
2. Ollama ChatModel：ローカルモデル ChatModel - Ollama
3. ARK ChatModel：ARK プラットフォーム ChatModel - ARK
自作実装の参考
カスタム ChatModel を実装するときの注意：
1. 共通 option を実装する
2. callback 機構を実装する
3. ストリーム出力終了時に writer を close する
Option 機構
共通 Option 以外が必要なら、コンポーネント抽象のヘルパーで独自 Option を定義できる。例：

go
import (
    "time"
    "github.com/cloudwego/eino/components/model"
)
// 定义 Option 结构体
type MyChatModelOptions struct {
    Options    *model.Options
    RetryCount int
    Timeout    time.Duration
}
// 定义 Option 函数
func WithRetryCount(count int) model.Option {
    return model.WrapImplSpecificOptFn(func(o *MyChatModelOptions) {
       o.RetryCount = count
    })
}
func WithTimeout(timeout time.Duration) model.Option {
    return model.WrapImplSpecificOptFn(func(o *MyChatModelOptions) {
       o.Timeout = timeout
    })
}


Callback 処理
ChatModel 実装は適切なタイミングでコールバックを発火する。ChatModel コンポーネントが定義する入出力：

go
import (
    "github.com/cloudwego/eino/schema"
)
// 定义回调输入输出
type CallbackInput struct {
    Messages    []*schema.Message
    Model       string
    Temperature *float32
    MaxTokens   *int
    Extra       map[string]any
}
type CallbackOutput struct {
    Message    *schema.Message
    TokenUsage *schema.TokenUsage
    Extra      map[string]any
}


実装サンプル（全体像）

go
import (
    "context"
    "errors"
    "net/http"
    "time"
    "github.com/cloudwego/eino/callbacks"
    "github.com/cloudwego/eino/components/model"
    "github.com/cloudwego/eino/schema"
)
type MyChatModel struct {
    client     *http.Client
    apiKey     string
    baseURL    string
    model      string
    timeout    time.Duration
    retryCount int
}
type MyChatModelConfig struct {
    APIKey string
}
func NewMyChatModel(config MyChatModelConfig) (MyChatModel, error) {
    if config.APIKey == "" {
       return nil, errors.New("api key is required")
    }
    return &MyChatModel{
       client: &http.Client{},
       apiKey: config.APIKey,
    }, nil
}
func (m MyChatModel) Generate(ctx context.Context, messages []schema.Message, opts ...model.Option) (*schema.Message, error) {
    // 1. 处理选项
    options := &MyChatModelOptions{
       Options: &model.Options{
          Model: &m.model,
       },
       RetryCount: m.retryCount,
       Timeout:    m.timeout,
    }
    options.Options = model.GetCommonOptions(options.Options, opts...)
    options = model.GetImplSpecificOptions(options, opts...)
    // 2. 开始生成前的回调
    ctx = callbacks.OnStart(ctx, &model.CallbackInput{
       Messages: messages,
       Config: &model.Config{
          Model: *options.Options.Model,
       },
    })
    // 3. 执行生成逻辑
    response, err := m.doGenerate(ctx, messages, options)
    // 4. 处理错误和完成回调
    if err != nil {
       ctx = callbacks.OnError(ctx, err)
       return nil, err
    }
    ctx = callbacks.OnEnd(ctx, &model.CallbackOutput{
       Message: response,
    })
    return response, nil
}
func (m MyChatModel) Stream(ctx context.Context, messages []schema.Message, opts ...model.Option) (schema.StreamReader[schema.Message], error) {
    // 1. 处理选项
    options := &MyChatModelOptions{
       Options: &model.Options{
          Model: &m.model,
       },
       RetryCount: m.retryCount,
       Timeout:    m.timeout,
    }
    options.Options = model.GetCommonOptions(options.Options, opts...)
    options = model.GetImplSpecificOptions(options, opts...)
    // 2. 开始流式生成前的回调
    ctx = callbacks.OnStart(ctx, &model.CallbackInput{
       Messages: messages,
       Config: &model.Config{
          Model: *options.Options.Model,
       },
    })
    // 3. 创建流式响应
    // Pipe产生一个StreamReader和一个StreamWrite，向StreamWrite中写入可以从StreamReader中读到，二者并发安全。
    // 实现中异步向StreamWrite中写入生成内容，返回StreamReader作为返回值
    // *StreamReader是一个数据流，仅可读一次，组件自行实现Callback时，既需要通过OnEndWithCallbackOutput向callback传递数据流，也需要向返回一个数据流，需要对数据流进行一次拷贝
    // 考虑到此种情形总是需要拷贝数据流，OnEndWithCallbackOutput函数会在内部拷贝并返回一个未被读取的流
    // 以下代码演示了一种流处理方式，处理方式不唯一
    sr, sw := schema.Pipe*model.CallbackOutput
    // 4. 启动异步生成
    go func() {
       defer sw.Close()
       // 流式写入
       m.doStream(ctx, messages, options, sw)
    }()
    // 5. 完成回调
    _, nsr := callbacks.OnEndWithStreamOutput(ctx, sr)
    return schema.StreamReaderWithConvert(nsr, func(t model.CallbackOutput) (schema.Message, error) {
       return t.Message, nil
    }), nil
}
func (m MyChatModel) BindTools(tools []schema.ToolInfo) error {
    // 实现工具绑定逻辑
    return nil
}
func (m MyChatModel) doGenerate(ctx context.Context, messages []schema.Message, opts MyChatModelOptions) (schema.Message, error) {
    // 实现生成逻辑
    return nil, nil
}
func (m MyChatModel) doStream(ctx context.Context, messages []schema.Message, opts MyChatModelOptions, sr schema.StreamWriter[*model.CallbackOutput]) {
    // 流式生成文本写入sr中
    return
}

参考資料

Eino 学習ノート 2

2025-04-11T00:00:00.000Z

Eino 学習ノート 2

Components

大規模言語モデルアプリ開発には、大きく次の 3 つのアプリモードがある。

1. 直接対話モード：ユーザー入力を処理し、応答を生成する

2. 知識処理モード：文書を意味的に処理し、保存・検索する

3. ツール呼び出しモード：文脈に基づいて判断し、適切なツールを呼ぶ

Eino はよく使う能力を再利用可能なコンポーネント（Components）として抽象化する。

コンポーネント抽象とモードの対応はおおむね次のとおり。

対話処理系

1. 大モデルとの対話パラメータをモジュール化する抽象：ChatTemplate

2. 大モデルと直接やりとりする抽象：ChatModel

テキスト意味処理系

1. 文書の取得・処理：Document.Loader、Document.Transformer

2. 文書の意味的処理：Embedding

3. Embedding 後のインデックス保存：Indexer

4. 意味的に関連する文書のインデックス化と取得：Retriever

意思決定・実行系

モデルが判断してツールを呼ぶ抽象：ToolsNode

カスタム

ユーザー定義ロジック：Lambda

Eino のコンポーネント設計の原則：

1. モジュール化と標準化：同種の能力を統一モジュールにまとめ、役割と境界を明確にし、柔軟な組み合わせを可能にする。

2. 拡張性：インターフェースの制約をできるだけ小さくし、カスタムコンポーネントの実装を容易にする。

3. 再利用性：よく使う能力と実装をパッケージ化し、すぐ使える形で提供する。

Chain & Graph のオーケストレーション

オーケストレーション：Components の原子能力を組み合わせ、つなぐこと。

ビジネスロジックをオーケストレーション層に混ぜない。

大規模言語モデルアプリの中心は「原子能力を提供するコンポーネント」の組み合わせであり、コンポーネントがオーケストレーションの第一級市民。

抽象としてのオーケストレーション：ネットワークを構築し、データが流れる。各ノードは流れてくるデータの形式・内容に要求を持つ。スムーズに流れるには「前後のノード間でデータ形式が揃っているか」が鍵。

シーンの複雑さはオーケストレーション成果物の複雑さに表れる。横断的なガバナンスがなければ複雑さは制御不能になりやすい。

モデルもアプリも急速に進化する。拡張できるアプリだけが長く生き残れる。

Eino は Graph モデル（辺＋ノード）に基づき、コンポーネントを原子ノードとし、前後の型の整合を土台にしたオーケストレーションを提供する。

コンポーネントを中心に、機能のカプセル化の仕方を規定する。

ビジネスロジックの複雑さはコンポーネント内部に閉じ、オーケストレーション層はより全体を見渡せる。

横断的関心（アスペクト）の仕組みがあり、コールバックでノード単位の統一的なガバナンスが可能（アスペクト能力とは何か、は別途）。

call option 機があり、高速イテレーションするシステムにとって拡張性は最低限の要求。

「型の整合」を強化した開発スタイルで認知負荷を下げ、Go の型安全を活かす。

ストリームの自動変換により、ストリームがオーケストレーション複雑性の主因リストから外れる（Eino のストリーム指向プログラミング）。

Graph の欠点：「点」「辺」モデルでは、開発者が graph.AddXXXNode() と graph.AddEdge() の 2 つでデータ経路を作る必要があり、強力だがやや煩雑。

Eino はより使いやすい Chain でラップしている。Chain は Graph のラッパーで、「環」を除けば Graph のほぼすべての能力をさらけ出す。

他言語

中文

English

学び方について——倪爽（転載）

2025-04-11T00:00:00.000Z

学び方について——倪爽（転載）

元ポスト：https://x.com/nishuang/status/1787939646129008771

私の学習法も一つ共有します。略称は「子どもを水に突き落とすと、最初は溺れなければそのうち勝手に泳げるようになり、しかも『泳ぎって習うもの？』と逆に聞いてくる……実用学習法」です。

#活到死学到死

デザインを学ぶ過程でやったことは、みんなと同じで、模倣、練習、研究、原理の学習、方法やテクニック……など。違うのは三つあります。

学校式の練習問題（単語帳と同じで虚構の用事）が特に嫌いで、自分・会社・クライアントの本当の案件を練習台にしている

その実案件があるからデザインに集中でき、多くのデザイナーが陥る自己陶酔や、自分を騙す偽りの自信を避けられる

まずデザインの仕事を引き受けてから、デザインの考え方や方法を学ぶ

一見プレッシャーが大きいが、難易度はコントロールでき、本当の自信が少しずつ積み上がる。会議で堂々と発言し、二、三言で「そう！」と自分に暗示をかけるのは、まだ浅い模倣であって本物の自信ではない

まずデザインし、学び、研究し、模倣し、実戦で経験を積み、落ち着いてから必要なところを深く学び直す。最後には戦略・経験・方法論などあらゆるレイヤーで高人を真似でき、表面だけの模倣にとどまらない

従来の教育の順序は、美術工員やコード職人のような技術労働者を育てるには向いているが、デザイナーのような創造仕事には、教育の効率は学習の効率に及ばない

変に聞こえますか？

実は多くの人が似たような方法で学び、成長しています。

この「水に突き落とす」学習法の利点は、強い正の報酬に完全に基づいていることです。好奇心が忍耐より強く、意志を知性で代用する性格の私には、一見難しく見えて実は自走するこの方法が合っています。

今日に至るまで、毎日デザインを学び、毎日自分を水に突き落としています。

関税と株価暴落をどう見るか——ウォーレン・バフェットの発言（転載）

2025-04-09T00:00:00.000Z

関税と株価暴落をどう見るか——ウォーレン・バフェットの発言（転載）

米国が中国に 104% の関税を課したのを見て、ある先輩が転載していた記事がある。ブログに転載して学習用に残す。自己学習目的のみ。

原文リンク：如何看待關稅和股市大跌？股神巴菲特這樣說

〔財経チャンネル／総合報道〕米国のトランプ大統領による相互関税が世界市場の揺れ動きを招いている。史上最も有名な投資家の一人、「株式の神」とも呼ばれるウォーレン・バフェットの考え方は常に注目され、海外メディアはバフェットの過去の発言を整理し、長年にわたり「関税」と「株価下落」の二つのテーマについても語ってきたと指摘している。バフェットがこれらをどう見ているかを押さえることは、現在の不安定な市場の筋を投資家が把握する助けになるかもしれない、と報じている。

CNBC の報道によれば、バフェットが関税について最近公に語ったのは 3 月初旬、米 CBS のノーラ・オドネル・アンカーへのインタビューで、関税は一般に物価上昇を招き、「時間が経つにつれ、関税は最終的には消費税のようなものに変わる」と述べたという。さらに冗談めかして、「歯の妖精がそれを払ってはくれない」とも言った、とされる。

報道は、バフェットはこの先何が起きるかすでに見通していた可能性があると指摘する。第一に「インフレ」——2018 年、トランプ政権の初めの比較的穏やかな関税について問われた際、バフェットはアルミニウムや鉄鋼などの関税が傘下の一部子会社のコストを押し上げたと述べた。トランプ政権が外国製品に関税をかける前から米国にはインフレの兆しがあったが、バフェットは「関税の状況はインフレ問題をさらに悪化させるだろう」と語った、という。

バフェットが懸念するもう一つの影響は「貿易戦争」——米国と貿易相手が関税を交互に引き上げて報復し合い、世界経済の成長を損なう可能性がある、という点だ。3 月のインタビューでは、バフェットは関税はある意味で戦争行為だとも述べた、とされる。

2019 年、米中の貿易緊張が高まるなか、バフェットの言い方はさらに率直だった。CNBC のインタビューで「本当に貿易戦争を始めれば、世界全体にとって良くない。世界経済は相互に連動しているからだ」と語った、という。

トランプ政権が最新の関税を発表したあと、S&P 500 は下落したが、まだ正式な「弱気相場」（直近の高値から 20% 以上下落）には入っていない。アナリストは、弱気相場に入るとすれば、投資家が貿易戦争が世界景気後退を招くのではないかと懸念しているためである可能性が高い、と指摘する。

そしてバフェットが世界規模の景気後退に初めて直面したわけではない。2008 年、世界金融危機が弱気相場を招いたとき、バフェットはニューヨーク・タイムズに寄稿し、「世界金融システムは混乱に陥っている。米国でも他地域でもそうだ。さらに悪いことに、これらの問題は実体経済にじわじわ染み込み、今や堤防が決壊したように制御不能だ」「短期的には失業率は上がり、商取引は停滞し、見出しはますます扇情的になるだろう」と書いた。

バフェットは続けて、「だから……私は米国株の買いを始めた」と述べた。

バフェットは、市場が次にどう動くかは予測できないと認めている。実際、2008 年 10 月にこの文章を発表したあと、S&P 500 は底を打って反発するまであと 5 か月下落した。

しかしバフェットが一貫して強調してきたように、企業全体は革新を続け、長期的には収益力を高め、それが株価の長期上昇につながる。2008 年、バフェットは多くの投資家がリスクに金を晒すことを嫌がっていると指摘した。

それでもバフェットは、こうした堅実な企業の長期的繁栄を疑うのは意味がないと考えている。「企業は時どき利益の波にさらされるが、これまでと同じだ。5 年、10 年、20 年後には、大多数の大企業はまた利益の新高値を記録しているだろう」と書いた。

バフェットは株価が相対的に安いときに買うことを好み、そうすれば長期リターンは高くなる。2008 年の文章では「簡単に言えば、悪い知らせは投資家にとって最高の友人だ。割引価格で米国の未来の一部を買えるからだ」と綴っている。

他言語版

中文

English

RPC-learning-notes-ja

2025-04-08T00:00:00.000Z

RPC 学習メモ

RPC — Remote Procedure Call — リモートプロシージャコール。

分散システムの通信問題を解くための仕組みで、ローカル呼び出しのようにリモート呼び出しを行えるのが特徴。RPC はマイクロサービスやクラウドネイティブ専用の用語ではなく、ネットワーク通信があれば使われうる。

例を二つ：

大規模な分散アプリは、メッセージキュー、分散キャッシュ、分散 DB、統合設定センターなどに依存することが多く、アプリとこれらミドルウェアの間も RPC で通信できる。例：etcd は統合設定サービスとして、クライアントが gRPC でサーバと通信する。

Kubernetes 自体が分散システムであり、kube-apiserver とクラスタ各コンポーネントの通信は gRPC で行われる。

RPC が扱う要素：

シリアライズ：オブジェクトを転送可能なバイト列にし、逆に復元する。ネットワーク越し・言語越しのデータ交換に使う。

圧縮アルゴリズム：転送量と帯域・遅延を抑える。

プロトコル：クライアントとサーバのルール（転送形式・対話モード）。HTTP/2、TCP、UDP など。

動的プロキシ：リモート呼び出しの複雑さを隠し、ローカルメソッドのように見せる。JDK 動的プロキシ、バイトコード強化など。

サービス登録・発見：インスタンスの可用性を動的管理し、LB やフェイルオーバを支える。ZooKeeper、Consul、ETCD などがアドレスとメタデータを保持。

暗号化：機密性・完全性。中間者攻撃や改ざんの防止。

ネットワーク通信：IO モデル、接続管理、送受信など。一見単純だが、対端探索、接続確立、エンコード／デコード、接続管理など含め非常に複雑。RPC はその全体をパッケージ化し、分散構築時の通信実装を簡単にし、安全・信頼性も高める。

RPC クラスタでよく出る話題：

監視

サーキットブレーカ・レート制限

グレースフルな起動・停止

マルチプロトコル

分散トレーシング

RPC フレームワークが強いところ：

接続管理

ヘルスチェック

ロードバランス

グレースフル起停

異常時リトライ

ビジネスグルーピング

サーキットブレーカ・流量制御

RPC がなければ別サーバの API をどう呼ぶ？

RPC はネットワークの細部を隠し、「リモートでも同じプロジェクト内のメソッドを呼ぶ」体験にする。リモートだからといって業務と無関係なコードを大量に書かなくてよい。

RPC の役割は主に二つ：

リモートとローカルの違いを隠し、プロジェクト内メソッド呼び出しに感じさせる。

下層ネットワークの複雑さを隠し、業務ロジックに集中できるようにする。

シリアライズ

ネットワーク上のデータはバイナリでなければならないが、呼び出し側の入出力はオブジェクト。事前に可逆なアルゴリズムでバイナリに変換する必要がある。

一般にヘッダは識別用（プロトコル ID、データサイズ、リクエスト種別、シリアライズ方式など）。ボディは業務パラメータと拡張属性など。

デシリアライズ

RPC は通信だけでなく、MQ・分散キャッシュ・DB への発行にも使える。

RPC と HTTP はどちらもアプリケーション層プロトコル。

RPC リクエストはネットワークに出す前にメソッド呼び出し引数をバイナリ化し、ローカルソケットに書き、NIC 経由でネットワーク機器へ送られる。

拡張性と後方互換のあるプロトコル設計では、ヘッダとペイロードの拡張フィールドを活用し、拡張フィールドで後方互換を取る。

場面に応じてシリアライズ方式を選ぶ。

よく使うシリアライズ：

JDK ネイティブシリアライズ

いずれのフレームワークも、本質はシリアライズプロトコルの設計にある。

JSON：典型的な Key-Value で型情報が弱く、テキスト型。

問題点：

- オーバーヘッドが大きく、大量データではメモリ・ディスク負荷が大きい。

- JSON に型がないため、Java のような強型言語では反射で統一処理になり性能が落ちる。

JSON を選ぶ RPC では、やり取りデータ量は小さめに抑えるべき。

Hessian：動的型・バイナリ・コンパクトで多言語移植可能。JDK や JSON よりコンパクトで高速、バイト数も少ない。

- ただし公式版は Java の一部型をサポートしない。

- Linked 系（LinkedHashMap など）は CollectionDeserializer 拡張で対応可能。

- Locale は ContextSerializerFactory 拡張で対応。

- Byte/Short が Integer になる等。

Protobuf：Google の構造化データ標準。IDL を書き各言語のコンパイラでコード生成。

- シリアライズ後のサイズが JSON/Hessian より小さい。

- IDL で意味が明確になり型が落ちにくい。

- 反射なしで高速なシリアライズ／デシリアライズ。

- メッセージ形式の更新と互換性が取りやすい。

（文中の「IDL なしで Java オブジェクトを…」の記述は原文どおり Protobuf 周辺の別実装の話として読める。）

ほかに MessagePack、kryo など。選定要因：

第一候補は Hessian と Protobuf が多い。性能・時間・空間・汎用性・互換・安全性のバランスが良い。Hessian は使いやすくオブジェクト互換に強い。Protobuf はより高速で汎用性に優れる。

RPC 利用時の注意：

オブジェクト構造が過度に複雑（属性が多く多層ネスト）。

オブジェクトが巨大すぎる。

フレームワークがサポートしない型を引数に使う。

継承関係が複雑。

ネットワーク IO モデル

RPC フレームワークはどの IO モデルを好むか。

よくある分類：

同期ブロッキング IO（BIO）

同期非ブロッキング IO（NIO）

IO 多路複用

非同期非ブロッキング IO（AIO）

非同期 IO と言えるのは AIO だけで、他は同期 IO。

ブロッキング IO は最も単純で一般的。Linux ではデフォルトでソケットはブロッキング。アプリが IO システムコールを出すとブロックしてカーネルへ。カーネルはデータ待ち、その後ユーザメモリへコピーして返る。待ちとコピーの両段階でスレッドはブロックし続ける。Java マルチスレッドなら IO 一つにつきスレッドが IO 完了まで占有される。 IO 多路複用 は高並列で広く使われる。Java NIO、Redis、Nginx の下層、古典的 Reactor もこの系。複数接続の IO を select などのマルチプレクサに登録し、ユーザが select を呼ぶとプロセスはブロックするが、カーネルが担当ソケットを監視し、どれかがレディになると select が返る。その後 read でカーネルからユーザへコピーする。流れはブロッキング IO より複雑に見えるが、一つのスレッドで複数ソケットの IO を扱えるのが最大の利点。同期ブロッキングだけでは同じことをマルチスレッドでしかできない。

なぜブロッキングと多路複用が多いか：カーネルがブロッキング・非ブロッキング・多路複用を大抵サポートするが、シグナル駆動 IO や真の非同期 IO は高めの Linux でないと弱い。言語面では C++/Java の高性能フレームワークの多くが Reactor＝多路複用ベース（Java なら Netty が代表）。低並列なら同期ブロッキングがよくある。

RPC は高並列が多い。カーネル・言語・モデル特性から、実装では IO 多路複用 を選ぶことが多い。言語フレームワークは Reactor 実装が最適（Java なら Netty が代表）。Linux では epoll を有効にする（Windows はカーネルが epoll をサポートしない）。

Reactor ベースのネットワーク IO とは？

イベント駆動の高性能ネットワークモデルで、IO イベントの待受・ディスパッチと業務処理を分離し、高並列接続をまとめて扱う。多路複用（select/epoll/kqueue）で複数接続を監視し、イベント種別ごとにハンドラへ渡すことで、ブロッキング IO のスレッド浪費を避ける。

主要コンポーネント：

- Reactor：全 IO を監視し Event Loop でレディイベントを配る。多くは単独スレッド。Selector で Channel の接続・読み書きを検知。

- Acceptor：接続確立を処理し、新しい SocketChannel を Reactor に登録。

- Handler：読み取り・デコード、書き戻し、重い処理はスレッドプールへ、など。

ゼロコピー（zero copy）

カーネルの IO は「データ待ち」と「データコピー」の二段階。待ちは NIC 受信後カーネルへ、コピーはカーネルからユーザ空間へ。

典型的な書き込み：ユーザバッファ → CPU でカーネルバッファ → DMA で NIC。往復でコピーは二度、読み込みも対称的に二度。各コピーでユーザ／カーネル間のコンテキスト切替が発生する。

ゼロコピーはユーザとカーネル間の余分なコピーを減らし、DMA でカーネルと NIC の間を直接扱う考え方。

代表案：

mmap + write：仮想メモリでカーネル読みバッファをユーザ空間にマップし共有。

sendfile：read/write を一つのシステムコールにまとめカーネル内で転送。SG-DMA があれば CPU を介さない経路も可能。

（詳細な mmap/sendfile の段数・長所短所は原文のブロッククォートと同趣旨：前処理が要るなら mmap+write、単純高速転送なら sendfile。）

Netty のゼロコピーは主に JVM 上のデータ操作最適化：

CompositeByteBuf で複数 ByteBuf を論理一体にしコピー回避。

slice で同一ストレージを共有する複数ビュー。

wrap で byte[] 等をラップしてコピー回避。

FileRegion + FileChannel.transferTo() は Linux の sendfile と同系。

動的プロキシ・プロトコル・サービス発見

動的プロキシ：インタフェース指向で RPC の処理を隠す（コードは未精読なら詳細は割愛）。

ネットワークは 信頼できる転送 を心に留める。

RPC はインタフェースに対しプロキシを生成する。DI でインタフェースを注入すると実行時はプロキシが束縛され、メソッド呼び出しをインターセプトしてリモート処理を差し込める。

実行時生成の速度・生成バイトコードサイズが性能に効く。小さいほどリソース節約。

毎回のメソッド呼び出しでプロキシが走るため実行効率が重要。

API の分かりやすさ、コミュニティ、依存の重さも選定要素。

gRPC プロトコルカプセル化

呼び出し引数のバイナリのあとに「区切り」記号を入れリクエストを分離し、区切りの間がペイロード。これがプロトコルカプセル化。

サービス発見：CP か AP か

1. サービス登録：プロバイダ起動時にレジストリへインタフェースを登録し、IP と情報を保存。

2. サービス購読：コンシューマ起動時にレジストリでプロバイダ IP を取得しローカルキャッシュ、以降のリモート呼び出しに利用。

DNS でのサービス発見

同一ドメインに全プロバイダを載せ、DNS でランダム IP を取って長接続、一見よさそうだが：

IP/ポートが落ちたとき即座にコンシューマが外せるか。

スケールアウトで新ノードにすぐ流量が乗るか。

多くの場合 いいえ。DNS は多段キャッシュで TTL が長めになりがち。

ZooKeeper ベース

1. 管理端が ZK にサービス根パス（例：/service/com.demo.xxService）を作り、その下に provider / consumer。

2. プロバイダ登録時に provider 側にエフェメラルノード。

3. コンシューマは consumer 側にエフェメラルノードを作り、provider ディレクトリを watch。

4. provider 配下が変わると ZK がコンシューマへ通知。

メッセージバスによる最終一貫性レジストリ

ZK は強い一貫性のため更新のたびにクラスタ全体が同期し、性能に影響する。RPC のサービス発見では、新ノードが数秒遅れで見えても許容できる場面が多い。CP を捨て AP（最終一貫性） に振るとレジストリ集群の性能・安定性とトレードオフできる。全レジストリがメモリに全データを持ち、メッセージバスで同期する方式が取れる。

あとがき

このあと gRPC や Kitex のコードリーディング、バイトダンス云原生の記事なども追う予定。本質的には OSS を離れて、より基礎に立ち返ることの方が大事。

投資対象としての金について

2025-04-05T00:00:00.000Z

投資対象としての金について

目論見は、読んだことを消化して自分の言葉でまとめる練習なので、学習用のメモとしての位置づけだ。

まずバフェットの言葉を引用する。

私は持株を金に換えるなど考えたことはない。優れた企業に賭け、その内在価値が着実に伸びると信じる方がいい。そうした企業は優秀な経営者が動かし、人々が今も未来も愛する製品を売っている。南アフリカの地下から金属を掘り出し、輸送や保険などの手続きを経て、ノックス堡の金庫にしまうより、人々は汗水で稼いだ給料で See's のピーナッツバターやコーラのようなものを買いたいと思うだろう。

父は金本位に傾倒していたが、私は金に興奮したことはない。実物を持ったことはないが、金を尊ぶ家庭で育ち、チャンスは十分与えた。それでも金の内在価値が何なのかずっと理解できない。ボーシャム（波仙）の宝石店では金製品も扱う。だが私は持株を売って金を買うことはしない。生産的資産を非生産的資産と交換する考えは、私には非常に遠い。

バフェットは株主への手紙でも金に触れている。

現金に近い資産のほかに、持つに適さない資産がある。自分からキャッシュフローを生まず、将来誰かがより高く買ってくれることだけを期待する資産——金、美術品、骨董などだ。彼はこれを無生産資産と呼び、対照的にキャッシュフローを生むのが有生産資産だ。

バフェットは金を例に二種の資産の違いを説明する。世界の金保有量はおおよそ十七万トンで、溶かし直せば一辺二十一メートルの立方体になる。その立方体は地球のどこかから掘り出され、精錬され、また穴を掘って埋め戻され、周りを人が固めて見張っている。そこから何も生み出されることはない。人々は買うのは、将来もっと多くの人がもっと高く買ってくれると期待するからだ。

金はキャッシュフローを生まず、将来他人がより高く買うことだけを期待する資産で、非生産的資産に分類される。

次に陳嘉禾氏の見方。

金は価値を生まない。良い株は利益を積み上げ、安い価格ならその利益を安く買える。金はそうはならない。きちんと保管しても金が増えるわけではない。

毎年資産が増え、良い資産は日々一歩ずつ積み上がり、複利でリターンが膨らむ。金の「成長ゼロ」という性質は、長い目で見ても投資物として優れない。バフェットと同じ筋だ。

金では「取引」で優位を積めない。株を持っていると、企業価値の成長を楽しみながら売買でポートフォリオのファンダメンタルを厚くできる。ほかに割安な株があれば乗り換え、ファンダメンタルがさらに伸びる。不動産やコレクターズアイテムも同様だ。だが金はすべて同質で、単純すぎて誰も価格を大きく誤定価しない。だから保有者は取引でファンダメンタルを積み増しにくい。その積み増しはバリュー投資にとって重要な武器だ。

金は避難にも役に立たない。多くの人は「いざというときに使える」と買うが、社会が金を頼るほど乱れたら、同じ金額で今日買える食料（缶詰）、武器、医薬品の方がはるかに価値がある。

以前飒飒（ササ）さんとも話したが、コロナの頃に金を少し買おうと思っていた——その考えは誤りだった。間違った考えを一つ手放せてよかった。

唐二僧氏の答えはさらにストレートで、金を買うのは内心の安心感、つまり情緒的価値を買っている、という。

性質が安定しているから貴重、希少だから貴重、コンセンサスがあるから貴重、のいずれ単独では理由にならない。

（でも三つそろえば貴重になるのでは、暗号資産も同じでは、と一瞬思う。よくわからない。素人すぎる！）

金は情緒価値を買う行為だと割り切り、強制貯金と捉えればいい。

参考資料：

投资闲谈：巴菲特谈黄金猫猫看市：为啥我不爱黄金我们买黄金到底是在买什么？

kubeedge-sedna-sourcecode-analysis-ja

2025-01-09T00:00:00.000Z

KubeEdge-Sedna ソースコード解析（転載）

原著者：jaypume

公開講義動画：https://www.bilibili.com/video/BV1hg4y1b78L

原著 README：https://github.com/jaypume/article/blob/main/sedna/边云协同AI框架Sedna源码解析/README.MD

学習・参照のため転載。

KubeEdge-Sedna 概要

Sedna は KubeEdge SIG AI で育てられてきたクラウド–エッジ協調 AI プロジェクトである。KubeEdge の協調能力により、連合推論・増分学習・連邦学習・ライフロング学習など、クラウドとエッジにまたがる学習・推論が可能になる。TensorFlow／PyTorch／MindSpore など主要フレームワークを想定しており、既存アプリを比較的スムーズに載せ替え、コスト・モデル性能・データプライバシー面での利点を狙える。

プロジェクト：

https://github.com/kubeedge/sedna

ドキュメント：

https://sedna.readthedocs.io

全体アーキテクチャ

Sedna の協調は KubeEdge の次の能力の上に乗る。

* クラウド–エッジ横断のアプリ統合オーケストレーション

* Router：管理面の高信頼メッセージ経路

* EdgeMesh：データ面のサービス発見とトラフィック制御

主なコンポーネント：

GlobalManager

- 協調 AI ジョブの一元管理

- クラウド–エッジ間の調整

- 中央設定

LocalController

- エッジ側のローカル制御

- モデル・データセット・状態同期などのローカル管理

Lib

- AI／アプリ開発者向けに協調機能を API として提供

Worker

- 学習・推論の実行（既存フレームワーク上のプログラム）

- 機能ごとにワーカー群があり、エッジ／クラウドに配置して協調

リポジトリ構成

| ディレクトリ | 内容 |

| --- | --- |

| .github | GitHub CI/CD 設定 |

| LICENSES | Sedna および vendor のライセンス |

| build | GM／LC 等の Dockerfile、生成 CRD YAML、サンプル CR |

| cmd | GM／LC のエントリ |

| components | 監視・可視化など |

| docs | proposal とインストール手順 |

| examples | 連合推論・増分・ライフロング・連邦学習の例 |

| hack | コード生成ツールや開発用スクリプト |

| lib | Python ライブラリ（協調 AI アプリ開発用） |

| pkg | API 定義、client-go 生成コード、GM／LC の中核 |

| scripts | 利用者向けインストールスクリプト |

| test | E2E とテストユーティリティ |

| vendor | サードパーティソース |

Sedna 管理面ソース（Go）

GM: Global Manager

GM は一種の Kubernetes Operator

Operator とは？

An Operator is an application-specific controller that extends the Kubernetes API to create, configure and manage instances of complex stateful applications on behalf of a Kubernetes user. It builds upon the basic Kubernetes resource and controller concepts, but also includes domain or application-specific knowledge to automate common tasks better managed by computers. 1

Sedna の GM は、協調 AI アプリにおけるワーカーのデプロイ・起動パラメータ、協調の仕方、データの流れなどを司る。「クラウド–エッジ協調 AI アプリ」というドメイン特化のコントローラと言える。

The following components form the three main parts of an operator:

- API: The data that describes the operand’s configuration. The API includes:

- Custom resource definition (CRD), which defines a schema of settings available for configuring the operand.

- Programmatic API, which defines the same data schema as the CRD and is implemented using the operator’s programming language, such as Go.

- Custom resource (CR), which specifies values for the settings defined by the CRD; these values describe the configuration of an operand.

- Controller: The brains of the operator. The controller creates managed resources based on the description in the custom resource; controllers are implemented using the operator’s programming language, such as Go. 2

Red Hat の定義によれば、Kubernetes Operator を構成する主な概念は CRD、API、CR、Controller である。

Sedna GM を Operator として見たときの模式図：

以降は CR、CRD、API、Controller の順に触れる。制御の本体は Controller。

CR

Sedna は連合推論・増分学習・ライフロング学習・連邦学習をサポートする。コード読みやすさのため本稿はライフロング学習の特性とサンプルに寄せて説明する。他三つも実装パターンは共通部分が多い。

CR サンプル

ライフロング学習の CR サンプルを引用する。これを kubectl で適用してリソースを作れる。手順の詳細は examples/lifelong_learning/atcii。主要フィールド：

dataset：データセット CR の名前（データセットも CR）。

trainSpec：学習ワーカーの Pod テンプレート（イメージ・環境変数など）。

trigger：学習ワーカーを起こす条件。

evalSpec：評価ワーカーのテンプレート。

deploySpec：推論ワーカーのテンプレート。

outputDir：学習で出力するモデルパス。

build/crd-samples/sedna/lifelonglearningjobv1alpha1.yaml

``yaml


apiVersion: sedna.io/v1alpha1
kind: LifelongLearningJob
metadata:
  name: atcii-classifier-demo
spec:
  dataset:
    name: "lifelong-dataset"
    trainProb: 0.8
  trainSpec:
    template:
      spec:
        nodeName:  "edge-node"
        containers:
          - image: kubeedge/sedna-example-lifelong-learning-atcii-classifier:v0.3.0
            name:  train-worker
            imagePullPolicy: IfNotPresent
            args: ["train.py"]
            env:
              - name: "early_stopping_rounds"
                value: "100"
              - name: "metric_name"
                value: "mlogloss"
    trigger:
      checkPeriodSeconds: 60
      timer:
        start: 02:00
        end: 24:00
      condition:
        operator: ">"
        threshold: 500
        metric: num_of_samples
  evalSpec:
    template:
      spec:
        nodeName:  "edge-node"
        containers:
          - image: kubeedge/sedna-example-lifelong-learning-atcii-classifier:v0.3.0
            name:  eval-worker
            imagePullPolicy: IfNotPresent
            args: ["eval.py"]
            env:
              - name: "metrics"
                value: "precision_score"
              - name: "metric_param"
                value: "{'average': 'micro'}"
              - name: "model_threshold"
                value: "0.5"
  deploySpec:
    template:
      spec:
        nodeName:  "edge-node"
        containers:
        - image: kubeedge/sedna-example-lifelong-learning-atcii-classifier:v0.3.0
          name:  infer-worker
          imagePullPolicy: IfNotPresent
          args: ["inference.py"]
          env:
          - name: "UT_SAVED_URL"
            value: "/ut_saved_url"
          - name: "infer_dataset_url"
            value: "/data/testData.csv"
          volumeMounts:
          - name: utdir
            mountPath: /ut_saved_url
          - name: inferdata
            mountPath: /data/
          resources:
            limits:
              memory: 2Gi
        volumes:
          - name: utdir
            hostPath:
              path: /lifelong/unseen_task/
              type: DirectoryOrCreate
          - name: inferdata
            hostPath:
              path:  /data/
              type: DirectoryOrCreate
  outputDir: "/output"

CRD

CRD は CR の雛形である。CR を作る前にクラスタへ CRD を登録する必要がある。YAML は手書きでもよいが、複雑ならツール生成が無難。Sedna は kubebuilder の controller-gen で CRD を生成・更新し、make crds で build/crds/ を更新する（Makefile の crds: controller-gen を参照）。


CRD では group・version・kind（GVK）が肝になる。CR インスタンスは Resource と呼ばれ、OO で言えば Kind がクラス、Resource がオブジェクトに近い。ライフロング学習の GVR／GVK は次表。
|  | Group | Version | Resource | Kind |
| --- | --- | --- | --- | --- |
| CRD | apiextensions.k8s.io | v1 | lifelonglearningjobs.sedna.io | CustomResourceDefinition |
| CR | sedna.io | v1alpha1 | lifelonglearningjob | LifelongLearningJob |
クラスタ内のリソースは REST URI で表される。パスの組み立ては次図のとおり。

規則が分かれば、管理対象の REST URL を手で組み立てられる。公式 client がない言語でも HTTP で叩ける。例：
ライフロング学習 CRD の取得：

plain text
curl -k --cert ./client.crt --key ./client.key https://127.0.0.1:5443/apis/apiextensions.k8s.io/v1beta1/customresourcedefinitions/lifelonglearningjobs.sedna.io


ライフロング学習 CR 一覧：

plain text
curl -k --cert ./client.crt --key ./client.key https://127.0.0.1:5443/apis/sedna.io/v1alpha1/lifelonglearningjobs


Sedna のライフロング学習 CRD で注目すべきフィールド：

apiVersion: apiextensions.k8s.io/v1 — 現行 CRD はこの API グループ。

kind: CustomResourceDefinition

spec.group: sedna.io

spec.names.kind: LifelongLearningJob

spec.names.shortNames: - ll — kubectl get ll などの短縮名。

build/crds/sedna.io_lifelonglearningjobs.yaml

yaml
apiVersion: apiextensions.k8s.io/v1
kind: CustomResourceDefinition
metadata:
  annotations:
    controller-gen.kubebuilder.io/version: v0.4.1
  creationTimestamp: null
  name: lifelonglearningjobs.sedna.io
spec:
  group: sedna.io
  names:
    kind: LifelongLearningJob
    listKind: LifelongLearningJobList
    plural: lifelonglearningjobs
    shortNames:
    - ll
    singular: lifelonglearningjob
  scope: Namespaced
  versions:
  - name: v1alpha1
	...
status:
  acceptedNames:
    kind: ""
    plural: ""
  conditions: []
  storedVersions: []


API
CRD を自動生成するための型定義は次にある。

pkg/apis/sedna/v1alpha1/lifelonglearningjob_types.go

go
package v1alpha1
import (
	v1 "k8s.io/api/core/v1"
	metav1 "k8s.io/apimachinery/pkg/apis/meta/v1"
)
// 这里展示了
// +genclient
// +k8s:deepcopy-gen:interfaces=k8s.io/apimachinery/pkg/runtime.Object
// +kubebuilder:resource:shortName=ll
// +kubebuilder:subresource:status
// 整体的LifelongLearningJob的API定义，主要包含Spec和Status定义，分别代表期望状态和实际状态。
type LifelongLearningJob struct {

metav1.TypeMeta json:",inline"

metav1.ObjectMeta json:"metadata"

Spec LLJobSpec json:"spec"

Status LLJobStatus json:"status,omitempty"


}
// 在创建LifelongLearningJob时候需要配置的参数；如果需要扩展终身学习字段的接口，可以在这里修改。
type LLJobSpec struct {

Dataset LLDataset json:"dataset"

TrainSpec LLTrainSpec json:"trainSpec"

EvalSpec LLEvalSpec json:"evalSpec"

DeploySpec LLDeploySpec json:"deploySpec"


	// the credential referer for OutputDir

CredentialName string json:"credentialName,omitempty"

OutputDir string json:"outputDir"


}
type LLDataset struct {

Name string json:"name"

TrainProb float64 json:"trainProb"


}
// 剩下还有一些结构体定义省略了。


補足：

// +kubebuilder... はコード生成ツール向けのディレクティブ。

LifelongLearningJob が Spec（望ましい状態）と Status（実状態）を持つ API の核。

LLJobSpec は CR 作成時にユーザーが埋めるフィールド。拡張もここから。

連合推論・増分・連邦学習の型は同じく pkg/apis/sedna/v1alpha1/ 以下。


client-go の再生成

*_types.go

 を変えたら次を実行：

plain text
bash hack/update-codegen.sh

生成物は pkg/client：

plain text
➜  pkg tree client -L 2
client
├── clientset
│   └── versioned
├── informers
│   └── externalversions
└── listers
    └── sedna


後述の Controller から参照される。
CRD YAML の更新
同様に型を変えたら：

plain text
make crds

出力先は build/crds。クラスタ側も kubectl apply で CRD を更新する。


Controller

ライフロング学習の中核は pkg/globalmanager/controllers/lifelonglearning/lifelonglearningjob.go（学習／評価ワーカーの起動タイミング、エッジへのパラメータ同期など）。


全体の呼び出しは次の疑似コードで把握できる：

go
cmd/sedna-gm/sedna-gm.go/main() 【1】
pkg/globalmanager/controllers/manager.go/New() 【2】GM 設定読み込み
pkg/globalmanager/controllers/manager.go/Start() 【3】GM プロセス起動
    - clientset.NewForConfig()：【4】client-go で Sedna CRD 用 clientset 生成
    - NewUpstreamController()：【5】UpstreamController 生成（GM プロセスあたり 1 つ）
    - uc.Run(stopCh)：for ループの goroutine で
        - pkg/globalmanager/controllers/upstream.go/syncEdgeUpdate() 
    - NewRegistry()：【6】全 controller 登録
        - f.SetDownstreamSendFunc()【7】
            -> pkg/globalmanager/controllers/lifelonglearning/downstream.go
        - f.SetUpstreamHandler()【8】
            -> pkg/globalmanager/controllers/lifelonglearning/upstream.go/updateFromEdge()
        - f.Run()【9】
    - ws.ListenAndServe() 【10】


LifelongLearningJob Controller の説明も、上記【1】〜【10】に沿う。

`【1】`main `エントリ`

sedna-gm.go は GM の入口。ログ初期化、app.NewControllerCommand()

 でフラグ解析と controller 起動。

cmd/sedna-gm/sedna-gm.go

go
func main() {
   rand.Seed(time.Now().UnixNano())
   command := app.NewControllerCommand()
   logs.InitLogs()
   defer logs.FlushLogs()
   if err := command.Execute(); err != nil {
      os.Exit(1)
   }
}


【2】GM 設定の読み込み
k8s 接続情報、WebSocket の待受アドレス／ポート、ナレッジベース（KB）URL などを読み込む。

pkg/globalmanager/controllers/manager.go

go
// New creates the controller manager
func New(cc config.ControllerConfig) Manager {
   config.InitConfigure(cc)
   return &Manager{
      Config: cc,
   }
}

pkg/globalmanager/config/config.go

go
// ControllerConfig indicates the config of controller
type ControllerConfig struct {
   // KubeAPIConfig indicates the kubernetes cluster info which controller will connected

KubeConfig string json:"kubeConfig,omitempty"


   // Master indicates the address of the Kubernetes API server. Overrides any value in KubeConfig.
   // such as https://127.0.0.1:8443
   // default ""

Master string json:"master"


   // Namespace indicates which namespace the controller listening to.
   // default ""

Namespace string json:"namespace,omitempty"


   // websocket server config
   // Since the current limit of kubeedge(1.5), GM needs to build the websocket channel for communicating between GM and LCs.

WebSocket WebSocket json:"websocket,omitempty"


   // lc config to info the worker

LC LCConfig json:"localController,omitempty"


   // kb config to info the worker

KB KBConfig json:"knowledgeBaseServer,omitempty"


   // period config min resync period
   // default 30s

MinResyncPeriodSeconds int64 json:"minResyncPeriodSeconds,omitempty"


【3】GM の全体初期化
Sedna CRD 用クライアント作成、クラウド–エッジメッセージ処理のバインド、機能別 controller の起動、WebSocket 待受開始、までをまとめて行う。

pkg/globalmanager/controllers/manager.go

go
// Start starts the controllers it has managed
func (m *Manager) Start() error {
   ...
   // 初始化Sedna CRD client，Controller会监听Sedna CR 增删改查的变化，并执行对应的处理逻辑。
   sednaClient, err := clientset.NewForConfig(kubecfg)
   ...
   sednaInformerFactory := sednainformers.NewSharedInformerFactoryWithOptions(sednaClient, genResyncPeriod(minResyncPeriod), sednainformers.WithNamespace(namespace))
   // 初始化UpstreamController，用于处理边缘LC上传的消息
   uc, _ := NewUpstreamController(context)
   downstreamSendFunc := messagelayer.NewContextMessageLayer().SendResourceObject
   stopCh := make(chan struct{})
   go uc.Run(stopCh)
   // 针对每个特性（协同推理、终身学习等），绑定对应的消息处理函数
   for name, factory := range NewRegistry() {
      ...
      f.SetDownstreamSendFunc(downstreamSendFunc)
      f.SetUpstreamHandler(uc.Add)
      ...
      // 启动各个特性对应controller
      go f.Run(stopCh)
   }
   ...
   // 启动整体GM的websocket，默认监听在0.0.0.0:9000这个端口地址
   ws := websocket.NewServer(addr)
   ...
}


【4】CRD クライアント初期化

clientset.NewForConfig() の実体は pkg/client/clientset/versioned/clientset.go

。codegen 済みの clientset で CR の CRUD を行う。

LifelongLearningJob Controller の New

 は主に次を行う：

LifelongLearningJob の Informer 取得（API Server 負荷軽減のローカルキャッシュ）


kube／sedna クライアントや GM 共通設定の注入
Job CR の Add／Update／Delete にコールバックを登録

pkg/globalmanager/controllers/lifelonglearning/lifelonglearningjob.go

go
// New creates a new LifelongLearningJob controller that keeps the relevant pods
// in sync with their corresponding LifelongLearningJob objects.
func New(cc *runtime.ControllerContext) (runtime.FeatureControllerI, error) {
   cfg := cc.Config
   podInformer := cc.KubeInformerFactory.Core().V1().Pods()
   // 获取LifelongLearningJob的Informer
   jobInformer := cc.SednaInformerFactory.Sedna().V1alpha1().LifelongLearningJobs()
   eventBroadcaster := record.NewBroadcaster()
   eventBroadcaster.StartRecordingToSink(&v1core.EventSinkImpl{Interface: cc.KubeClient.CoreV1().Events("")})
   // 配置LifelongLearningJob Controller的参数
   jc := &Controller{
      kubeClient: cc.KubeClient,
      client:     cc.SednaClient.SednaV1alpha1(),
      queue:      workqueue.NewNamedRateLimitingQueue(workqueue.NewItemExponentialFailureRateLimiter(runtime.DefaultBackOff, runtime.MaxBackOff), Name),
      cfg:        cfg,
   }
   // 绑定LifelongLearningJob CRD资源的Add、Update、Delete对应事件的回调函数。
   jobInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{
      AddFunc: func(obj interface{}) {
         jc.enqueueController(obj, true)
         jc.syncToEdge(watch.Added, obj)
      },
      UpdateFunc: func(old, cur interface{}) {
         jc.enqueueController(cur, true)
         jc.syncToEdge(watch.Added, cur)
      },
      DeleteFunc: func(obj interface{}) {
         jc.enqueueController(obj, true)
         jc.syncToEdge(watch.Deleted, obj)
      },
   })
   jc.jobLister = jobInformer.Lister()
   jc.jobStoreSynced = jobInformer.Informer().HasSynced
   // 绑定Pod对应的增删改对应事件的回调函数。
   podInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{
      AddFunc:    jc.addPod,
      UpdateFunc: jc.updatePod,
      DeleteFunc: jc.deletePod,
   })
   jc.podStore = podInformer.Lister()
   jc.podStoreSynced = podInformer.Informer().HasSynced
   return jc, nil
}


図は他モジュールから Sedna clientset を参照している例。

【5】アップストリーム（エッジ→クラウド）の初期化

uc.Run() が UpstreamController

 を回し、エッジ LC からの更新をまとめて処理する。

ループでメッセージレイヤから受け取り、uc.updateHandlers[kind] で連合推論・増分・連邦・ライフロングなど種別ごとのハンドラに振る。

pkg/globalmanager/controllers/upstream.go

go
// syncEdgeUpdate receives the updates from edge and syncs these to k8s.
func (uc *UpstreamController) syncEdgeUpdate() {
   for {
      select {
      case <-uc.messageLayer.Done():
         klog.Info("Stop sedna upstream loop")
         return
      default:
      }
      update, err := uc.messageLayer.ReceiveResourceUpdate()
	  ...
      handler, ok := uc.updateHandlers[kind]
      if ok {
         err := handler(name, namespace, operation, update.Content)
         ...
      }
   }
}

ReceiveFromEdge は LC からのメッセージをブロッキングで受ける経路（実装はレイヤ内で nodeMessage

 等として扱う）。

pkg/globalmanager/messagelayer/ws/context.go

go
// ReceiveResourceUpdate receives and handles the update
func (cml ContextMessageLayer) ReceiveResourceUpdate() (ResourceUpdateSpec, error) {
   nodeName, msg, err := wsContext.ReceiveFromEdge()
   ...
}


【6】Controller の登録

NewRegistry() が機能ごとの New

 を束ねる。新しい協調機能を足すならここにエントリを追加する。

pkg/globalmanager/controllers/registry.go

go
func NewRegistry() Registry {
   return Registry{
      ji.Name:      ji.New,
      fe.Name:      fe.New,
      fl.Name:      fl.New,
      il.Name:      il.New,
      ll.Name:      ll.New,
      reid.Name:    reid.New,
      va.Name:      va.New,
      dataset.Name: dataset.New,
      objs.Name:    objs.New,
   }
}


【7】クラウド→エッジの同期

f.SetDownstreamSendFunc() が各機能の syncToEdge

 を下流送信に結び付ける。
ライフロング学習では概ね次の順：
Dataset CR からデータ所在ノードを取得
Annotation から学習／評価／デプロイ各フェーズのノード名を取得
現在フェーズに応じてメッセージを送る先を切り替える

pkg/globalmanager/controllers/lifelonglearning/downstream.go

go
func (c *Controller) syncToEdge(eventType watch.EventType, obj interface{}) error {
   // 获取到对应的数据集指定的节点（Dataset CRD对象中有一个字段记录了Node名称）
   ds, err := c.client.Datasets(job.Namespace).Get(context.TODO(), dataName, metav1.GetOptions{})
   
   // 获取到训练、评估、部署对应的节点名称
   getAnnotationsNodeName := func(nodeName sednav1.LLJobStage) string {
      return runtime.AnnotationsKeyPrefix + string(nodeName)
   }
   ann := job.GetAnnotations()
   if ann != nil {
      trainNodeName = ann[getAnnotationsNodeName(sednav1.LLJobTrain)]
      evalNodeName = ann[getAnnotationsNodeName(sednav1.LLJobEval)]
      deployNodeName = ann[getAnnotationsNodeName(sednav1.LLJobDeploy)]
   }
   
   ...
   // 根据LifelongLearningJob所处阶段不同，发送消息到不同的节点上
   switch jobStage {
   case sednav1.LLJobTrain:
      doJobStageEvent(trainNodeName)
   case sednav1.LLJobEval:
      doJobStageEvent(evalNodeName)
   case sednav1.LLJobDeploy:
      doJobStageEvent(deployNodeName)
   }
   return nil
}


【8】エッジ→クラウドの同期

f.SetUpstreamHandler() が updateFromEdge

 を登録する。
ライフロング学習では：
LC からの報告に応じてジョブ全体の状態を更新

LifelongLearningJob の Status を k8s に書き戻す


JSON 本文をパースする。GM が受け取る例：

json
{
    "phase": "train",
    "status": "completed",
    "output": {
        "models": [{
            "classes":  ["road", "fence"],
            "current_metric": null,
            "format": "pkl",
            "metrics": null,
            "url": "/output/train/1/index.pkl"
        }],
        "ownerInfo": null
    }
}

pkg/globalmanager/controllers/lifelonglearning/upstream.go

go
// updateFromEdge syncs the edge updates to k8s
func (c *Controller) updateFromEdge(name, namespace, operation string, content []byte) error {
   var jobStatus struct {

Phase string json:"phase"

Status string json:"status"


   }
   
   // 把边缘消息结构体进行解析。
   err := json.Unmarshal(content, &jobStatus)
   ...
   cond := sednav1.LLJobCondition{
      Status:             v1.ConditionTrue,
      LastHeartbeatTime:  metav1.Now(),
      LastTransitionTime: metav1.Now(),
      Data:               string(condDataBytes),
      Message:            "reported by lc",
   }
   // 根据不同的边缘节点任务状态实现，变更当前LifelongLearningJob的整体状态
   switch strings.ToLower(jobStatus.Status) {
   case "ready":
      cond.Type = sednav1.LLJobStageCondReady
   case "completed":
      cond.Type = sednav1.LLJobStageCondCompleted
   case "failed":
      cond.Type = sednav1.LLJobStageCondFailed
   case "waiting":
      cond.Type = sednav1.LLJobStageCondWaiting
   default:
      return fmt.Errorf("invalid condition type: %v", jobStatus.Status)
   }
   // 将当前LifelongLearningJob的整体状态写回k8s，也就是LifelongLearningJob这个CR的Status字段。
   err = c.appendStatusCondition(name, namespace, cond)
   ...
}


【9】Controller のメイン処理

各機能の Run がワーカーを起動する。ライフロングでは WaitForNamedCacheSync で Pod／Job の Informer 同期を待ってから worker を回す。

pkg/globalmanager/controllers/lifelonglearning/lifelonglearningjob.go

go
// Run starts the main goroutine responsible for watching and syncing jobs.
func (c *Controller) Run(stopCh <-chan struct{}) {
   workers := 1
   defer utilruntime.HandleCrash()
   defer c.queue.ShutDown()
   klog.Infof("Starting %s controller", Name)
   defer klog.Infof("Shutting down %s controller", Name)
   if !cache.WaitForNamedCacheSync(Name, stopCh, c.podStoreSynced, c.jobStoreSynced) {
      klog.Errorf("failed to wait for %s caches to sync", Name)
      return
   }
   klog.Infof("Starting %s workers", Name)
   for i := 0; i < workers; i++ {
      go wait.Until(c.worker, time.Second, stopCh)
   }
   <-stopCh
}

worker は processNextWorkItem を回し、キューから key を取り出して sync

 に渡す。

pkg/globalmanager/controllers/lifelonglearning/lifelonglearningjob.go

go
// worker runs a worker thread that just dequeues items, processes them, and marks them done.
// It enforces that the syncHandler is never invoked concurrently with the same key.
func (c *Controller) worker() {
   for c.processNextWorkItem() {
   }
}

続けて sync の本体。

pkg/globalmanager/controllers/lifelonglearning/lifelonglearningjob.go

go
func (c *Controller) sync(key string) (bool, error) {
   //省略了部分代码
   ns, name, err := cache.SplitMetaNamespaceKey(key)
   sharedJob, err := c.jobLister.LifelongLearningJobs(ns).Get(name)
   // if job was finished previously, we don't want to redo the termination
   if IsJobFinished(&job) {
      return true, nil
   }
   // transit this job's state machine
   needUpdated, err = c.transitJobState(&job)
   if needUpdated {
      if err := c.updateJobStatus(&job); err != nil {
         return forget, err
      }
      if jobFailed && !IsJobFinished(&job) {
         // returning an error will re-enqueue LifelongLearningJob after the backoff period
         return forget, fmt.Errorf("failed pod(s) detected for lifelonglearningjob key %q", key)
      }
      forget = true
   }
   return forget, err
}

sync

 は個別ジョブの状態機械を進める：
key を namespace／name に分割

lister で LifelongLearningJob を取得

transitJobState で学習→評価→デプロイなどへ遷移すべきか判断

変化があれば updateJobStatus で API に反映（kubectl で見える最新フェーズやモデルパスなど）


失敗時の再キュー／エラー処理

go
// transit this job's state machine
needUpdated, err = c.transitJobState(&job)

transitJobState()

 がフェーズ遷移の中核。詳細は次の状態図と照らすとよい。

【10】WebSocket サーバ起動

【8】の LC からのメッセージを受ける WebSocket。デフォルトは 0.0.0.0:9000。

pkg/globalmanager/controllers/manager.go

go
addr := fmt.Sprintf("%s:%d", m.Config.WebSocket.Address, m.Config.WebSocket.Port)
ws := websocket.NewServer(addr)
err = ws.ListenAndServe()


LC: Local Controller

LC はエッジノード上で動き、ローカルジョブ管理とメッセージ中継を担う。エントリは cmd/sedna-lc/sedna-lc.go（GM 章と同様の読み方）。ローカルマネージャ登録部分：

cmd/sedna-lc/app/server.go

go
// runServer runs server
func runServer() {
   c := gmclient.NewWebSocketClient(Options)
   if err := c.Start(); err != nil {
      return
   }
   dm := dataset.New(c, Options)
   mm := model.New(c)
   jm := jointinference.New(c)
   fm := federatedlearning.New(c)
   im := incrementallearning.New(c, dm, mm, Options)
   lm := lifelonglearning.New(c, dm, Options)
   s := server.New(Options)
   for _, m := range []managers.FeatureManager{
      dm, mm, jm, fm, im, lm,
   } {
      s.AddFeatureManager(m)
      c.Subscribe(m)
      err := m.Start()
      if err != nil {
         klog.Errorf("failed to start manager %s: %v",
            m.GetName(), err)
         return
      }
      klog.Infof("manager %s is started", m.GetName())
   }
   s.ListenAndServe()
}


ローカルジョブ管理

エッジ側のジョブを束ねる Manager の構造体：

pkg/localcontroller/managers/lifelonglearning/lifelonglearningjob.go

go
// LifelongLearningJobManager defines lifelong-learning-job Manager
type Manager struct {
   Client                 clienttypes.ClientI
   WorkerMessageChannel   chan workertypes.MessageContent
   DatasetManager         *dataset.Manager
   LifelongLearningJobMap map[string]*Job
   VolumeMountPrefix      string
}

startJob()

 の流れの要点：
エッジに同期された Dataset を監視し、サンプル数しきい値などで学習トリガーを判断
フェーズに応じて学習／評価／デプロイ処理を呼ぶ。実際の Pod 起動は GM 側オーケストレーションに任せ、LC は状態を GM に報告する

pkg/localcontroller/managers/lifelonglearning/lifelonglearningjob.go

go
// startJob starts a job
func (lm *Manager) startJob(name string) {
   ...
    
   // 监控并处理同步到边缘的Dataset对象。 
   go lm.handleData(job)
   tick := time.NewTicker(JobIterationIntervalSeconds * time.Second)
   for {
      // 根据当前任务不同阶段，触发不同阶段的训练、评估、部署任务。
      select {
      case <-job.JobConfig.Done:
         return
      case <-tick.C:
         cond := lm.getLatestCondition(job)
         jobStage := cond.Stage
         switch jobStage {
         case sednav1.LLJobTrain:
            err = lm.trainTask(job)
         case sednav1.LLJobEval:
            err = lm.evalTask(job)
         case sednav1.LLJobDeploy:
            err = lm.deployTask(job)
         default:
            klog.Errorf("invalid phase: %s", jobStage)
            continue
         }
		 ...
      }
   }
}


ほかにもデータセット監視、モデル取得、ローカル DB バックアップなどがある。
メッセージプロキシ

状態変化はクラウドへ送るほか、ローカル 0.0.0.0:9100 で HTTP サーバを立て、Lib からのワーカー報告を集約して GM へ転送する。REST ルート例：

pkg/localcontroller/server/server.go

go
// register registers api
func (s Server) register(container restful.Container) {
	ws := new(restful.WebService)
	ws.Path(fmt.Sprintf("/%s", constants.ServerRootPath)).
		Consumes(restful.MIME_XML, restful.MIME_JSON).
		Produces(restful.MIME_JSON, restful.MIME_XML)
	ws.Route(ws.POST("/workers/{worker-name}/info").
		To(s.messageHandler).
		Doc("receive worker message"))
	container.Add(ws)
}

pkg/localcontroller/server/server.go

go
// messageHandler handles message from the worker
func (s Server) messageHandler(request restful.Request, response *restful.Response) {
   var err error
   workerName := request.PathParameter("worker-name")
   workerMessage := workertypes.MessageContent{}
   err = request.ReadEntity(&workerMessage)
   if workerMessage.Name != workerName || err != nil {
      var msg string
      if workerMessage.Name != workerName {
         msg = fmt.Sprintf("worker name(name=%s) in the api is different from that(name=%s) in the message body",
            workerName, workerMessage.Name)
      } else {
         msg = fmt.Sprintf("read worker(name=%s) message body failed, error: %v", workerName, err)
      }
      klog.Errorf(msg)
      err = s.reply(response, http.StatusBadRequest, msg)
      if err != nil {
         klog.Errorf("reply messge to worker(name=%s) failed, error: %v", workerName, err)
      }
   }
   if m, ok := s.fmm[workerMessage.OwnerKind]; ok {
      m.AddWorkerMessage(workerMessage)
   }
   err = s.reply(response, http.StatusOK, "OK")
   if err != nil {
      klog.Errorf("reply message to worker(name=%s) failed, error: %v", workerName, err)
      return
   }
}


Sedna Lib（Python）
Lib は AI／アプリ開発者向けの Python パッケージで、既存コードを協調型に載せ替えやすくする。
ディレクトリ構成：

plain text
➜  sedna tree lib -L 2
lib
├── __init__.py
├── MANIFEST.in
├── OWNERS
├── requirements.dev.txt
├── requirements.txt    // Sedna Pythonの依存
├── sedna
│   ├── algorithms  // 協調向けアルゴリズム
│   ├── backend     // tensorflow/pytorch 等のバックエンド
│   ├── common
│   ├── core        // 各機能の中核ロジック
│   ├── datasources // txt/csv 等のデータソース
│   ├── __init__.py
│   ├── README.md
│   ├── service     // KB などサーバが要るコンポーネント
│   ├── VERSION
│   └── __version__.py
└── setup.py


代表的なコード片を領域ごとに見る。
core

ユーザーの train などをラップし、TensorFlow／PyTorch／MindSpore 実装を呼び出す。


後処理コールバックの設定
クラウド KB を介した学習・推論
KB の更新（ライフロングではモデルとサンプルが蓄積される）
進捗・メトリクスを LC へ報告

lib/sedna/core/lifelong_learning/lifelong_learning.py

python
def train(self, train_data,
          valid_data=None,
          post_process=None,
          **kwargs):
    is_completed_initilization = \
        str(Context.get_parameters("HAS_COMPLETED_INITIAL_TRAINING",
                                   "false")).lower()
    if is_completed_initilization == "true":
        return self.update(train_data,
                           valid_data=valid_data,
                           post_process=post_process,
                           **kwargs)
    # 配置后处理函数
    callback_func = None
    if post_process is not None:
        callback_func = ClassFactory.get_cls(
            ClassType.CALLBACK, post_process)
    res, seen_task_index = \
        self.cloud_knowledge_management.seen_estimator.train(
            train_data=train_data,
            valid_data=valid_data,
            **kwargs
        ) 
    # 调用云端知识库进行训练、或推理
    unseen_res, unseen_task_index = \
        self.cloud_knowledge_management.unseen_estimator.train()
    # 更新云端知识库
    task_index = dict(
        seen_task=seen_task_index,
        unseen_task=unseen_task_index)
    task_index_url = FileOps.dump(
        task_index, self.cloud_knowledge_management.local_task_index_url)
    task_index = self.cloud_knowledge_management.update_kb(task_index_url)
    res.update(unseen_res)
    ...
    
    # 将当前训练任务执行的情况发送给LC，比如训练任务是否完成、训练后的指标是多少
    self.report_task_info(
            None, K8sResourceKindStatus.COMPLETED.value, task_info_res)
        self.log.info(f"Lifelong learning Train task Finished, "
                      f"KB index save in {task_index}")
        return callback_func(self.estimator, res) if callback_func else res
    
    ...


backend

MSBackend は MindSpore バックエンドの一例。フレームワークごとに train／predict／evaluate

 を揃えれば、Lib から協調実行へ載せられる。

lib/sedna/backend/mindspore/__init__.py

python
class MSBackend(BackendBase):
    def __init__(self, estimator, fine_tune=True, **kwargs):
        super(MSBackend, self).__init__(estimator=estimator,
                                        fine_tune=fine_tune,
                                        **kwargs)
        self.framework = "mindspore"
        if self.use_npu:
            context.set_context(mode=context.GRAPH_MODE,
                                device_target="Ascend")
        elif self.use_cuda:
            context.set_context(mode=context.GRAPH_MODE,
                                device_target="GPU")
        else:
            context.set_context(mode=context.GRAPH_MODE,
                                device_target="CPU")
        if callable(self.estimator):
            self.estimator = self.estimator()
    def train(self, train_data, valid_data=None, **kwargs):
        if callable(self.estimator):
            self.estimator = self.estimator()
        if self.fine_tune and FileOps.exists(self.model_save_path):
            self.finetune()
        self.has_load = True
        varkw = self.parse_kwargs(self.estimator.train, **kwargs)
        return self.estimator.train(train_data=train_data,
                                    valid_data=valid_data,
                                    **varkw)
    def predict(self, data, **kwargs):
        if not self.has_load:
            self.load()
        varkw = self.parse_kwargs(self.estimator.predict, **kwargs)
        return self.estimator.predict(data=data, **varkw)
    def evaluate(self, data, **kwargs):
        if not self.has_load:
            self.load()
        varkw = self.parse_kwargs(self.estimator.evaluate, **kwargs)
        return self.estimator.evaluate(data, **varkw)


datasource
CSV などよく使う形式のパースをまとめている。

lib/sedna/datasources/__init__.py

python
class CSVDataParse(BaseDataSource, ABC):
    """
    csv file which contain Structured Data parser
    """
    # 提供了方便的数据集解析函数，
    def parse(self, args, *kwargs):
        x_data = []
        y_data = []
        label = kwargs.pop("label") if "label" in kwargs else ""
        usecols = kwargs.get("usecols", "")
        if usecols and isinstance(usecols, str):
            usecols = usecols.split(",")
        if len(usecols):
            if label and label not in usecols:
                usecols.append(label)
            kwargs["usecols"] = usecols
        for f in args:
            if isinstance(f, (dict, list)):
                res = self.parse_json(f, **kwargs)
            else:
                if not (f and FileOps.exists(f)):
                    continue
                res = pd.read_csv(f, **kwargs)
            if self.process_func and callable(self.process_func):
                res = self.process_func(res)
            if label:
                if label not in res.columns:
                    continue
                y = res[label]
                y_data.append(y)
                res.drop(label, axis=1, inplace=True)
            x_data.append(res)
        if not x_data:
            return
        self.x = pd.concat(x_data)
        self.y = pd.concat(y_data)


algorithms
協調 AI 向けに、難例マイニング（HEM）などを同梱する。例として交差エントロピーしきい値で「モデルが自信がない」サンプルを拾う。
Lib はこれらの基礎実装にとどまらず、協調フレームワーク上でアルゴリズムを差し替え・拡張して全体の学習／推論品質を上げることを狙う。

lib/sedna/algorithms/hard_example_mining/hard_example_mining.py

python
@ClassFactory.register(ClassType.HEM, alias="CrossEntropy")
class CrossEntropyFilter(BaseFilter, abc.ABC):
    """

Object detection Hard samples discovery methods named CrossEntropy


    Parameters
    ----------
    threshold_cross_entropy: float
        hard coefficient threshold score to filter img, default to 0.5.
    """
    def __init__(self, threshold_cross_entropy=0.5, **kwargs):
        self.threshold_cross_entropy = float(threshold_cross_entropy)
    def __call__(self, infer_result=None) -> bool:
        """judge the img is hard sample or not.
        Parameters
        ----------
        infer_result: array_like
            prediction classes list, such as
            [class1-score, class2-score, class2-score,....],
            where class-score is the score corresponding to the class,
            class-score value is in [0,1], who will be ignored if its
            value not in [0,1].
        Returns
        -------
        is hard sample: bool

True means hard sample, False means not.


        """
        if not infer_result:
            # if invalid input, return False
            return False
        log_sum = 0.0
        data_check_list = [class_probability for class_probability
                           in infer_result
                           if self.data_check(class_probability)]
        if len(data_check_list) != len(infer_result):
            return False
        for class_data in data_check_list:
            log_sum += class_data * math.log(class_data)
        confidence_score = 1 + 1.0 * log_sum / math.log(
            len(infer_result))
        return confidence_score < self.threshold_cross_entropy

1. https://www.redhat.com/en/topics/containers/what-is-a-kubernetes-operator

2. https://developers.redhat.com/articles/2021/06/22/kubernetes-operators-101-part-2-how-operators-work

Shemol's Blog

Claude Code の Memory 管理

Claude Code の Memory 管理

他言語

陳皓（耗子）氏と「3.25」——知恵袋の記録（転載）

陳皓（耗子）氏と「3.25」——知恵袋の記録（転載）

他言語版

2026.1.31

2026.1.31

フルスタック（当面はフロントを）

Agent

Memory

論文

インターン

オープンであること

運動

最後に

2026.1.4 — Agent

2026.1.4 — Agent

技術実践

Context Engineering の枠組み

Skills 機構の仕組み

他言語

year-review-2025-ja

年末の振り返り——2025

2025.12.28

2025.12.28

他言語版

2025.12.21

2025.12.21

bytedance-frontend-eg-camp-ja

バイトダンス フロントエンド工程トレーニングキャンプ オンライン試験

単一選択

データ構造とアルゴリズム

コンピュータネットワーク

HTML、CSS、JS

プログラミング問題

Context-Engineering-for-AI-Agents-with-LangChain-and-Manus-ja

LangChain と Manus に見る AI エージェントのコンテキストエンジニアリング

LangChain 側の話

コンテキストをファイルシステムへオフロード

コンテキストの削減（リダクション）

コンテキストの取得（リトリーブ）

コンテキストの分離（アイソレーション）

コンテキストのキャッシュ

Manus 側の話

コンテキスト削減：コンパクション vs 要約

コンテキスト分離：「共有メモリで通信するな」

コンテキストオフロード：階層化されたアクション空間

五つの次元をつなぎ、過剰設計を避ける

Q&A

Q&A — シェルツールとサンドボックス

Q&A — インデックスとファイルシステムによる文脈取得

Q&A — 進化するモデルへの適応

Q&A — データ保存フォーマット

Q&A — 要約のプロンプト設計

Q&A — 検索結果のコンパクション

Q&A — エージェント間通信と MapReduce

Q&A — モデル選択とオープンモデル

Q&A — ツール選択と階層化アクション空間（再訪）

Q&A — プランニングと To‑Do

Q&A — マルチエージェント設計と役割

Q&A — サンドボックス環境の安全とガードレール

Q&A — 評価（Eval）

Q&A — 検証可能報酬 RL とツール呼び出しエージェント

context-engineering-ai-agents-langchain-manus-ja

AI エージェントのためのコンテキスト工学（LangChain と Manus）

LangChain 側の知見

コンテキストをファイルシステムへ卸す

コンテキストの圧縮

オンデマンドでコンテキストを取り戻す

コンテキストの分離

コンテキストのキャッシュ

Manus 側の知見

コンテキスト圧縮：Compaction と Summarization

コンテキスト分離：通信と共有メモリ

コンテキストオフロード：階層化された行動空間

五つの軸をつなぎ、過剰設計を避ける

Q&A（要旨訳。原文の意図に合わせる）

シェルツールとサンドボックス

バイトダンスフロントエンド工程トレーニングキャンプオンライン試験

2025年バークシャー株主総会メモ

2025年バークシャー株主総会メモ