p.tatapa.org

p.tatapa.org

Gemini 2.5 Flashが2.0と比べて最初のトークンまでの時間が長い。簡単な入力を2.0と2.5に同時に送った場合、2.0が1秒未満で返ってくるのに、2.5は7秒くらいかかる。単にたまたまサーバが混んでいるだけだといいんだけど。
replies
1
announces
0
likes
0

Gemini 2.5 Flashはデフォルトでdynamic thinkingが有効になってるからかもしれない。

https://ai.google.dev/gemini-api/docs/thinking#set-budget