Gemini 2.5 Flashが2.0と比べて最初のトークンまでの時間が長い。簡単な入力を2.0と2.5に同時に送った場合、2.0が1秒未満で返ってくるのに、2.5は7秒くらいかかる。単にたまたまサーバが混んでいるだけだといいんだけど。
Gemini 2.5 Flashはデフォルトでdynamic thinkingが有効になってるからかもしれない。
https://ai.google.dev/gemini-api/docs/thinking#set-budget
https://ai.google.dev/gemini-api/docs/thinking#set-budget
- replies
- 0
- announces
- 0
- likes
- 0