「LLMは推論ができない」というのを示すのは難しくて、例えばAppleの論文に対するコメントとして、「そもそも問題が数学的に解けないケースが混ざっていた」「出力トークン数の限界で解けないケースが混ざっていた」といった指摘がある。
https://arxiv.org/abs/2506.09250v2
また、前記コメントでも触れられているけど、LLMは出力トークン数限界に余裕がある段階でも話をまとめてしまう場合がある。これはおそらく出力トークン数限界で回答が途中で止まった場合、強化学習で低い点数が付いてしまうため、少な目にしている可能性がある(私見)。
さらに、出力トークン数限界が原理的には足りていたとしても、内部で表現できるデータ構造の複雑さの限界に達している可能性がある。デコーダオンリーモデルの場合、前のトークンに関する内部状態は後ろにトークンを追加しても変化しない。そのため、「推論の結果矛盾が導かれたので『あの仮定』は間違いであった」などの情報を表現する場合、「後ろのトークンの内部状態に仮定に関する情報も含めて全て詰め込む」か「仮定部分へのポインタを埋め込み、それを辿っていく」かのどちらかになる。しかし、ポインタを辿るにはその分トランスフォーマーのレイヤが必要となる。そのため、解くのに失敗した問題であっても、内部のベクトル長を伸ばすかレイヤ数を増やせば問題が解けるようになる可能性はある。
なので、本質的にLLMは推論ができないのか、単にリソースが足りていないだけなのかは簡単には言えないはず。
日本やイギリスを含む25か国の外相がイスラエルを非難する声明を出した。
https://www.cnn.co.jp/world/35235763.html
その一方で、イギリスは軍用機にスプレーを吹き付けたり、軍事関連企業の通信ケーブルを切ったりして抗議した団体(パレスチナ・アクション)をテロ組織と指定し、同組織に連帯を示しただけの人まで100人以上逮捕している。
https://www.theguardian.com/uk-news/2025/jul/19/palestine-action-protests-uk-london-arrests
Anthropicがアラブ首長国連邦やカタールからの投資を求めるという計画に関する社内のメモ(Slackメッセージ)が流出したという記事。
https://www.wired.com/story/anthropic-dario-amodei-gulf-state-leaked-memo/
記事によると、Anthropicは以前から独裁者からの投資を受けることに反対していたものの、OpenAIがアラブ首長国連邦の国営投資会社から資金援助を受けたことや、アメリカ政府がデータセンターの建設で合意したことを受けて、競争のためにAnthropicも投資を求める方針とした、とのこと。
Anthropicが中国とのAI競争のために電力が必要だから政府はAI業界にいろいろ融通してくれという報告書を出してる。
https://www.anthropic.com/news/build-ai-in-america
・これから学習も推論も大量の電力が必要となる見込みとしている。
・地熱、天然ガス、原子力について開発に必要な手続き(環境関連の審査など)の高速化を求めている。
・政府が持っている土地の貸与も求めている。
・中国との競争を引き合いに出して煽っている(そもそも“United States”ではなく“America”という語を全面に出している)。
これは“Anthropic”(人類の)という名前を掲げて言うことなのか。AI業界にちょっと付いていけない気がしてきた。
スイスでは麻酔無しで痛みを伴う処理(去勢や除角など)をした食肉等を販売する際にその旨の表示が義務付けられたらしい。小売店のほか外食も対象とのこと。元々それらの処理はスイス国内では禁止されていて、輸入品が対象らしい。
https://www.news.admin.ch/de/newnsb/kBa7CcbvEMu-Nr-0oXvh4
https://www.vox.com/future-perfect/419385/switzerland-meat-mutilation-anesthesia-milk-egg-label
消費者全体が動物性食品を避けるようになるのか、あるいは「人道的に育成された」というラベルがあちこちに付いて「畜産は人道的にされている」という宣伝をすることになるのか。
ところで途中に出てきた猿をネットで扇動された人間の比喩と取る意見があるけど、あれはあくまで煽動者のボットなんじゃないだろうか。扇動された人間ははっきり人間として描かれているし、憎悪と相手の非人間化はモチーフの1つなので猿として描くのは整合しないし、猿を劣った存在の比喩として使うのも全体的な動物の扱いや、クリプトン人は地球人を劣った生き物だと見ていたという問題提起と合わない。
映画の『スーパーマン』見た。一番印象に残ってるのが最後の方で協力を申し出た技術者を突き放した数秒のシーンで、中立的な技術者を気取ってるんじゃないぞ、という意味だと解釈した。中立的でいないことはテーマの1つであるし。
全体的には途中あたりから漫画的な演出が合わなかった。90年近く昔からやってる漫画だからと言われればそうだけど。
https://windsurf.com/blog/windsurf-launch
ChromiumベースのAIブラウザが乱立してるのはブラウザ拡張APIの失敗という感じだし、VS CodeベースのAIエディタが乱立してるのもVS Codeの拡張APIの失敗という感じがする。
ChromiumベースのAIブラウザが乱立してるのにManifest V3はどの程度影響しているんだろうか。
Anthropic, Google, OpenAI and xAI get $800M to hop in bed with Pentagon
なんか最近のイケてるAI企業はLinearをMCPで使うみたいなんだけど、プロジェクト管理/課題管理ツール多すぎない?
課題一覧.xlsxはやだというのはわかるけど、なんかこう、Backlog.mdがSharePoint上で動くぐらいのちょうどよさが欲しい。Microsoftが実装してSharePointに標準実装して欲しい。
「『Linearから課題を取ってきてコードを修正します』よりも『SharePoint上の課題一覧.xlsxを見てコードを修正します』の方が喜ばれるのでは? Excel方眼紙もいい感じに解釈できるでしょAIなら」
「課題一覧.xlsxな企業はAIツールにお金を出さないのでは」
「AIツールを導入するために社内ルールに沿った稟議書を書くAIツールが必要」
Anthropicとアメリカ国防省の連携の続報。Palantirとも連携しているとか。
Windsurf、数日前にGoogleと協業かと思ったら、Cognition (Devinの会社)に買収されてた。
https://windsurf.com/blog/windsurfs-next-chapter
それはいいんだけど、“Last week, we lost our founders and our research team”という書き方なんだ。
「ダメージが入る」の「入る」って辞書的にどういう意味? 「ひびが入る」の「入る」? それとも装甲の内側に入るという意味?
○ ダメージが入る
? ダメージを入れる
○ ダメージを受ける
○ ダメージを与える
○ ダメージを食らう
○ ダメージを食らわせる
○ ダメージを負う
? ダメージを負わせる
? ダメージが通る
? ダメージを通らせる
ちなみにてにをは辞典には「ダメージが入る」は載っていなかった。
これはパイプではない (イメージの裏切り。絵に描かれたパイプはパイプではない)。
これはお酒です (ここにあるのは実際のお酒である。酒は裏切らない)。
画像はイメージです (イメージは裏切るが、イメージがイメージそのものであるという1点のみは裏切らない)。