联系我们

课程大纲

混元多模态基础与实验室设置

  • 理解混元在图像、3D和视频用例中的多模态能力。
  • 为创意、产品和内容团队识别实际业务场景。
  • 准备实验室环境、样本资产和模型访问权限。
  • 运行首次生成任务并审查输出。

提示设计与工作流模式

  • 构建提示以获得一致的多模态结果。
  • 使用文本提示、参考图像和基本输入设置。
  • 选择适合图像、视频或3D生成的工作流。
  • 根据输出质量和业务意图迭代提示。

图像生成与审查实验室

  • 从提示中创建营销、产品和概念图像。
  • 优化视觉风格、构图和内容一致性。
  • 审查输出的实用性、质量和品牌契合度。
  • 组织图像输出以供审批和后续使用。

视频生成实验室

  • 从提示和准备好的输入中创建短视频输出。
  • 控制风格、场景意图和输出变化。
  • 审查视频的清晰度、连续性和实用性。
  • 准备视频输出以用于演示或内容工作流。

3D资产创建实验室

  • 从文本或图像输入生成基本3D资产。
  • 检查几何形状、纹理质量和资产可用性。
  • 导出资产以用于可视化、原型设计或内容管道。
  • 比较何时适合使用3D生成与图像或视频工作流。

集成、治理与下一步

  • 通过简单的应用、服务或API交付生成的资产。
  • 将多模态输出连接到产品、内容和审查工作流。
  • 应用质量、品牌安全、版权和负责任使用的实际检查。
  • 规划试点用例和内部采用的下一步。

要求

  • 对AI和生成式AI概念有基本了解。
  • 有使用web应用、API或常见开发者工具的经验。
  • 具备基本的Python或脚本编写经验。

目标受众

  • 开发AI功能产品的开发者。
  • 技术产品经理和解决方案架构师。
  • 从事图像、视频或3D内容创作的创新、媒体和数字团队。
 14 小时

即将举行的公开课程

课程分类