TIL: OpenAIの一部のモデルには、「予測される出力」を与えてレイテンシを下げられる機能がある。ソースコードの一部のみ編集するとき、元のソースコードを渡すとかする。おそらく投機的デコーディングみたいなことをやってるんだと思うけど、マッチするのは先頭以外でもよい。
https://platform.openai.com/docs/guides/predicted-outputs
https://platform.openai.com/docs/guides/predicted-outputs
- replies
- 0
- announces
- 0
- likes
- 0