Cerebrasのgpt-oss-120b使ってみて、確かに速いけど、OpenRouter経由だとCerebrasのplaygroundと比べてスループットもレイテンシも結構悪化する感じがする。Cerebrasのplaygroundも最初にキュー待ちメッセージが出るのでその分を入れれば同じぐらいかも。
InceptionのMercuryも速い。Mercuryは直近の編集のdiffと現在のファイルとカーソル位置などを渡すと予想される編集を返す機能があるらしい。ただしOpenRouter経由ではなく直接呼び出す必要があるっぽい?
https://platform.inceptionlabs.ai/docs#endpoints
Emacs用のクライアントを書くべきか。
https://platform.inceptionlabs.ai/docs#endpoints
Emacs用のクライアントを書くべきか。
- replies
- 0
- announces
- 0
- likes
- 0