p.tatapa.org

p.tatapa.org

ると | @ruto@p.tatapa.org

プログラミング(関数型言語とJava多め)、その他言葉遊びなどを書いてます。アイコンは「腕時計」。ヘッダー画像は2-3フィンガーツリー。

9月末まで暑いとして、あと100日くらい暑い。

Gemini 2.5 Flashはデフォルトでdynamic thinkingが有効になってるからかもしれない。

https://ai.google.dev/gemini-api/docs/thinking#set-budget

高速でステップ実行するには、KVキャッシュとかの内部状態を保ったまま少し入力して少し出力できるLLMを作るか単純にすごく高速なLLMを作るかが必要。音声対話用LLMの技術が使えそう。

コーディングエージェントがデバッガ使えるようになったら面白そう。すごい速さでステップ実行してバグ特定してほしい。さらにソースのないバイナリの解析とかもしてほしい。

Office Open XMLの仕様を参照しつつ実際のPowerPointでいい感じに表示される.pptxファイルを出力するというのをコーディングエージェントでやるのは、技術的には不可能ではないかもしれないけどそれ自体がチャレンジングな一仕事になりそう。

Gemini 2.5 Flashが2.0と比べて最初のトークンまでの時間が長い。簡単な入力を2.0と2.5に同時に送った場合、2.0が1秒未満で返ってくるのに、2.5は7秒くらいかかる。単にたまたまサーバが混んでいるだけだといいんだけど。

梅雨も一雲剥けば真夏。

一応、文学において“Polyphony”とか“Polyphonic Writing”という言葉はあるらしい。

https://en.wikipedia.org/wiki/Polyphony_(literature)

https://www.quora.com/What-is-polyphonic-writing

ところでLLMが仲介するSNSについてLLM達に聞いてみたところ、GPT-4.1が「ポリフォニック要約」という言葉を出してきた。「ポリフォニック要約」とは何かと聞いたところ、Gemini 2.0 Flash, Claude Sonnet 4.0, GPT-4.1, Sonar Proの全てが「複数の異なる視点を保持しながら要約する方法」という旨の説明をした。しかし、"Polyphonic Summarization"や"ポリフォニック要約"でGoogle検索してもそのような用語は全くヒットしない。複数のLLMが全てハルシネーションを起こし、しかも内容が同じようなのは興味深いというか怖いというか。

逆にエコーチャンバーになりにくいSNSとしては、人間同士は直接やりとりできず、LLMをはさんでやりとりするようなものが考えられる。人間が出した様々な意見をLLMが穏当にまとめて提示してLLMとのみ対話する。もちろんLLM自体の偏りや、ユーザの意見に同調しがちな傾向による限界もあるけど、9割方わかりあえない相手の1割の意見を取り込むようなことはできるんじゃないだろうか。

@tadd そう普通はBeamerなりHTMLベースのクールななにかなんだけど、だからこそそうでないところにニッチがある、といいな。

I’ve released it! A command-line tool that generates PowerPoint presentations from Markdown and DuckDB SQL.

https://plotance.github.io/

You can create presentations like this: https://plotance.github.io/examples.html

You can pass variables from the command line and reference them within your SQL queries and Markdown content.

リリースしました! MarkdownとDuckDBのSQLからPowerPointを生成するコマンドラインツールです。

https://plotance.github.io/

こんな感じのスライドが作れます: https://plotance.github.io/examples.html

コマンドラインから変数を渡すこともできて、SQLの中からもMarkdownの中からも参照できます。

Pixelのマニュアルで「リチウムイオンバッテリーは消耗品であるため」“Lithium-ion batters are consumable components”って書いてあって「消耗することが本質的でないものも消耗品というのだろうか。バッテリーを充放電すると副作用で劣化するというのと、鉛筆を使うと減るというのとは違うのではないか」と思って辞書を調べたり考えたりしてみたんだけど、消耗品性は製品ライフサイクルやシステムの中でそれが交換可能かなどによって決まるもので、あるものについて「それが消耗品である」とは言えなくて「それを消耗品として位置付けている」と言うべきなのではないだろうか。携帯電話のバッテリーは交換を想定しているが、フラッシュメモリは交換を前提としておらず、消耗品性が低い。一方、スマートウォッチやワイヤレスイヤホンのバッテリーは交換を前提としていないものも多く、消耗品性が低い(あるいは製品全体が消耗品として扱われている)。

https://support.google.com/pixelphone/answer/15738128?hl=ja

コマンドラインやGitHubのイシューでエージェントにタスクを(並列で)投げて後でレビューという形は、LLMが1000倍速くなったらあまり使われなくなって、エディタ内で対話的に使う方が主流になるんじゃないだろうか。

コードの編集は末尾への追加よりも途中の変更が多いので、自己回帰モデルでdiffを生成するよりは拡散モデルやエンコーダーオンリーモデルでコード全体からコード全体へ変換する方が向いているんじゃないだろうか。

OpenAI o3の値下げが発表されると同日にWindsurfのo3も値下げになっていて、さらにWindsurfの新機能の背景として公式ブログでも触れているので、値下げ情報を事前に共有してもらえる程度には仲が良いらしい。買収については特に両社からは何も出ていないけど。

https://windsurf.com/blog/windsurf-wave-10-planning-mode

アルミって言うと軽そうだし石というと重そうだけど、比重はだいたい同じ程度なのか。

去年の9月に公開されていたらしい。

SwiftとJavaを連携させるための仕組みが公開されていた。
https://github.com/swiftlang/swift-java

SwiftからJavaのコードを呼べる(オブジェクトのインスタンスも作れるし、クラスメソッドも呼べる)。SwiftでJavaのネイティブメソッドを実装できる。双方向とも宣言を自動生成するツールがある。

»