支持 text, vision, audio, video, tool-use, function-calling, structured-outputs
价格基于使用的 token 数量,或根据模型类型的其他指标计算。
支持 text, image-generation