p.tatapa.org

p.tatapa.org

ると | @ruto@p.tatapa.org

プログラミング(関数型言語とJava多め)、その他言葉遊びなどを書いてます。アイコンは「腕時計」。ヘッダー画像は2-3フィンガーツリー。

ななてんばー
はちとーばー
くべんばー
じゅっせんばー

プラスチックの魚型の醤油入れがオーストラリアで禁止されるとのこと。30 ml未満の醤油が入った蓋付きの容器がだめらしく、袋入りのものは大丈夫らしい。

https://www.theguardian.com/australia-news/2025/aug/31/south-australia-bans-soy-sauce-fish-packets-in-world-first-to-cut-single-use-plastics

日本でもあまり見なくなった印象だけど、いまどの程度使われているんだろうか。

ついさっき「気づいたら12時半になってたし、買い物に行ってお昼ごはんにしよう」と思ったらこんな時間になってた。太陽の角度がおかしいと思った。

一般論としては、「LLMはパターンマッチしているに過ぎない」などの主張はそれだけではあまり意味がなくて、例えばパターンマッチしてそれに応じて出力をするのを繰り返す機械はチューリング完全である(λ計算のインタプリタは式にパターンマッチして書き換えているに過ぎない)。なので、どのようなパターンマッチであるか(どの程度の表現力があるパターンマッチなのか)が重要である。

これ、完全に統制されたデータセットで事前学習したのとモデルが小さいせいで、汎用的な推論能力を獲得できていないという可能性はないだろうか。なんか形式論理とか代数とかの問題を事前学習に加えたら向上したりしない? 一般のLLMの場合、パラメータ数や事前学習データ量を増やしたときに、途中まではあまり性能が上らないけどある時点でいっきに上がるとか、プログラムのソースコードを読ませたら一般的な能力が向上するとかあったはず。

https://tjo.hatenablog.com/entry/2025/08/27/173000

re: だれかC言語詳しい人教えて、どういうことなの
@tadd CじゃなくてC++だけど、やはり-(92...L)って解釈になるので、-9223372036854775807L - 1Lって書く必要があるらしい(一番下のExample)。 https://en.cppreference.com/w/cpp/language/integer_literal.html

要求事項: シャンプーのボトルは詰め替える前に、ポンプを含めて全て洗って完全に乾かす必要がある。

問題: 夜に使い終わってから次の日までにポンプを含めて全て洗って完全に乾かすのはたいへん。

解決案: ボトルを2セット用意する。使っていない方のボトルは時間があるときに洗って塩素消毒して乾かす。

WIREDにAIが生成した虚偽らしき記事が載ってしまったので撤回しました、という記事なんだけど、この訂正記事(8月21日付け)はWIREDの記事一覧には載ってない?

https://www.wired.com/story/how-wired-got-rolled-by-an-ai-freelancer/

少なくともRSSの受信記録にも、“Most Recent”の記事一覧の10ページ目(8月中旬)までにも、“Culture”の記事一覧の7ページ目(4月中旬)までにもこのタイトルの記事は無かった。

撤回された記事はこちら: https://www.wired.com/story/they-fell-in-love-playing-minecraft-then-the-game-became-their-wedding-venue/

拡散モデルは単純に考えると学習データのいずれか1つをそのまま確率的に出力するだけになりそうなのに、なぜ多様な出力が得られるのかという問題に対する論文。

https://arxiv.org/abs/2412.20292

https://www.quantamagazine.org/researchers-uncover-hidden-ingredients-behind-ai-creativity-20250630/

次の2点が重要なのではないかとのこと。

・ニューラルネットワークが画像等の全体ではなく周辺の情報のみを元に出力を決めていること。

・画像等の全ての場所で同じニューラルネットワークを使っていること。

これにより、各場所の値を決める際に、その周辺を見て、いずれかの学習データのいずれかの似た場所に近づける形になるけど、各場所ごとにどの学習データのどの場所に近づけるかは異なるので、多様な結果が得られる、としている。

例えば、白黒2値画像で真っ黒な画像と真っ白な画像の2つを学習データとして、各ピクセルの周辺3×3を元に中心の画素を決める場合、周辺に黒が多ければ中心を黒として、白が多ければ白とする形になる。これをノイズから始めると真っ黒でも真っ白でもない模様に収束する(Figure 3)。

これで「赤い照明の下の猫」と「青い照明の下の猫」とかを上手く作れるのかよくわからないけど、その辺りは複数のタグ等による条件付きスコア(確率が上がる方向)が混ぜ合わされることとか、ピクセル領域ではなく潜在領域で値を扱うこととかで上手くいくとかだろうか。

Gmailユーザはパスワードを変えるべきとGoogleが言っているという記事が流れてきて、Googleからそのようなアナウンスはないし、各種技術系ニュースサイトでもそのような記事はなくておかしいと思ってたら、やはりGoogleはそんなことは言っていなかった。

https://www.forbes.com/sites/zakdoffman/2025/08/25/google-warns-most-gmail-users-must-change-passwords/

・Googleが使っているSalesforceのデータベースが6月に侵入され、顧客(中小企業)に関する情報が盗まれたもののパスワード等は流出していない(既報)。

・Redditでフィッシングが報告されている(メールおよび電話によるもの)が、Salesforceの件との関係は特に示されていない。

・Googleは今回の件とは無関係にPasskeyの利用などを推奨している。

といったもので、特にパスワードを変えろとか、ましてや定期的に変えろとか、ブラウザ組み込みでないパスワードマネージャを使えなどとは言っていない(Forbesなどが言ってるだけ)。また、25億人というのも単にGmailとGoogle Cloudのユーザ数で、今回の流出によって危険になった人数ではない。

https://cloud.google.com/blog/topics/threat-intelligence/voice-phishing-data-extortion

https://workspace.google.com/blog/identity-and-security/defending-against-account-takeovers-top-threats-passkeys-and-dbsc

ナスとトマトのペペロンチーノ(唐辛子)はみんなナス科で遺伝子が近すぎる。唐辛子を胡椒にして、ナスかトマトを海苔とかキノコにすれば遺伝的に遠くなる。

InceptionのMercuryも速い。Mercuryは直近の編集のdiffと現在のファイルとカーソル位置などを渡すと予想される編集を返す機能があるらしい。ただしOpenRouter経由ではなく直接呼び出す必要があるっぽい?

https://platform.inceptionlabs.ai/docs#endpoints

Emacs用のクライアントを書くべきか。

Cerebrasのgpt-oss-120b使ってみて、確かに速いけど、OpenRouter経由だとCerebrasのplaygroundと比べてスループットもレイテンシも結構悪化する感じがする。Cerebrasのplaygroundも最初にキュー待ちメッセージが出るのでその分を入れれば同じぐらいかも。

@tadd 具体的な例としては、クレジットカードの場合は例えばSteamで違法なものを売っているとされたとき、クレジットカード会社も責任を問われるので、クレジットカード会社がSteamとユーザとの取り引きを止めます、というのがこの文脈での「検閲」である(私自身はそれを「検閲」という言葉で呼ぶことに必ずしも同意はしないのだけど、「暗号通貨の耐検閲性」という話をする際にはそのような前提があるという認識である)。
ビットコインの場合、少なくともビットコインの開発者が店舗とユーザの取り引きを禁止することはできない。Steamの場合はまだ「ビットコインと引き換えにサービスを提供することを禁止する法律」でそれを禁止することはできるけど、オンライン上にしかない匿名のサービスであればそのような規制を少なくとも技術的には受けない。
それに対して、法定通貨に裏付けされたステーブルコインの場合は運営者が結局クレジットカード会社と同じようにSteamとユーザの間の取り引きを「検閲」をするのではないかという懸念がある。具体的にはそのようなことを技術的に可能にしなければならないという規制を運営者が法律で受け得る。では運営者がそのような法が及ばないところでステーブルコインを運営できるかというと、そのような場所では「法定通貨に裏付けされている」と言うことが困難なので運営できない。

@tadd ビットコインの場合は開発者や中央的な運営者がなんらかの約束を破ったときに詐欺や民事で訴えられるかどうかに依存せずに価値を実現している。

もちろんビットコインを受け取って商品を渡さないとかの詐欺はできるけど、私が前のコメントで言っている詐欺というのはコインの運営者がいつでも日本円と交換するという約束に関する詐欺である。

@tadd 詐欺をするのはコインの運営者の方。検閲を受けるのは利用者の方。

@tadd ここで言う実効性というのはなに? なぜ法と関係ない?

@tadd 前提として、ここで言う「検閲」というのは誰かに取引を禁止されることを指していて、価値を失わせることは実質的に禁止となる。

»