Gemini 2.5 Flashはデフォルトでdynamic thinkingが有効になってるからかもしれない。
https://ai.google.dev/gemini-api/docs/thinking#set-budget
https://ai.google.dev/gemini-api/docs/thinking#set-budget
Office Open XMLの仕様を参照しつつ実際のPowerPointでいい感じに表示される.pptxファイルを出力するというのをコーディングエージェントでやるのは、技術的には不可能ではないかもしれないけどそれ自体がチャレンジングな一仕事になりそう。
Gemini 2.5 Flashが2.0と比べて最初のトークンまでの時間が長い。簡単な入力を2.0と2.5に同時に送った場合、2.0が1秒未満で返ってくるのに、2.5は7秒くらいかかる。単にたまたまサーバが混んでいるだけだといいんだけど。
一応、文学において“Polyphony”とか“Polyphonic Writing”という言葉はあるらしい。
ところでLLMが仲介するSNSについてLLM達に聞いてみたところ、GPT-4.1が「ポリフォニック要約」という言葉を出してきた。「ポリフォニック要約」とは何かと聞いたところ、Gemini 2.0 Flash, Claude Sonnet 4.0, GPT-4.1, Sonar Proの全てが「複数の異なる視点を保持しながら要約する方法」という旨の説明をした。しかし、"Polyphonic Summarization"や"ポリフォニック要約"でGoogle検索してもそのような用語は全くヒットしない。複数のLLMが全てハルシネーションを起こし、しかも内容が同じようなのは興味深いというか怖いというか。
逆にエコーチャンバーになりにくいSNSとしては、人間同士は直接やりとりできず、LLMをはさんでやりとりするようなものが考えられる。人間が出した様々な意見をLLMが穏当にまとめて提示してLLMとのみ対話する。もちろんLLM自体の偏りや、ユーザの意見に同調しがちな傾向による限界もあるけど、9割方わかりあえない相手の1割の意見を取り込むようなことはできるんじゃないだろうか。
@tadd そう普通はBeamerなりHTMLベースのクールななにかなんだけど、だからこそそうでないところにニッチがある、といいな。
I’ve released it! A command-line tool that generates PowerPoint presentations from Markdown and DuckDB SQL.
You can create presentations like this: https://plotance.github.io/examples.html
You can pass variables from the command line and reference them within your SQL queries and Markdown content.
リリースしました! MarkdownとDuckDBのSQLからPowerPointを生成するコマンドラインツールです。
こんな感じのスライドが作れます: https://plotance.github.io/examples.html
コマンドラインから変数を渡すこともできて、SQLの中からもMarkdownの中からも参照できます。
Pixelのマニュアルで「リチウムイオンバッテリーは消耗品であるため」“Lithium-ion batters are consumable components”って書いてあって「消耗することが本質的でないものも消耗品というのだろうか。バッテリーを充放電すると副作用で劣化するというのと、鉛筆を使うと減るというのとは違うのではないか」と思って辞書を調べたり考えたりしてみたんだけど、消耗品性は製品ライフサイクルやシステムの中でそれが交換可能かなどによって決まるもので、あるものについて「それが消耗品である」とは言えなくて「それを消耗品として位置付けている」と言うべきなのではないだろうか。携帯電話のバッテリーは交換を想定しているが、フラッシュメモリは交換を前提としておらず、消耗品性が低い。一方、スマートウォッチやワイヤレスイヤホンのバッテリーは交換を前提としていないものも多く、消耗品性が低い(あるいは製品全体が消耗品として扱われている)。
https://support.google.com/pixelphone/answer/15738128?hl=ja
https://support.google.com/pixelphone/answer/15738128?hl=ja
コマンドラインやGitHubのイシューでエージェントにタスクを(並列で)投げて後でレビューという形は、LLMが1000倍速くなったらあまり使われなくなって、エディタ内で対話的に使う方が主流になるんじゃないだろうか。
コードの編集は末尾への追加よりも途中の変更が多いので、自己回帰モデルでdiffを生成するよりは拡散モデルやエンコーダーオンリーモデルでコード全体からコード全体へ変換する方が向いているんじゃないだろうか。
OpenAI o3の値下げが発表されると同日にWindsurfのo3も値下げになっていて、さらにWindsurfの新機能の背景として公式ブログでも触れているので、値下げ情報を事前に共有してもらえる程度には仲が良いらしい。買収については特に両社からは何も出ていないけど。
https://windsurf.com/blog/windsurf-wave-10-planning-mode
https://windsurf.com/blog/windsurf-wave-10-planning-mode
SwiftとJavaを連携させるための仕組みが公開されていた。
https://github.com/swiftlang/swift-java
SwiftからJavaのコードを呼べる(オブジェクトのインスタンスも作れるし、クラスメソッドも呼べる)。SwiftでJavaのネイティブメソッドを実装できる。双方向とも宣言を自動生成するツールがある。
https://github.com/swiftlang/swift-java
SwiftからJavaのコードを呼べる(オブジェクトのインスタンスも作れるし、クラスメソッドも呼べる)。SwiftでJavaのネイティブメソッドを実装できる。双方向とも宣言を自動生成するツールがある。