MMagic 服务计算巢部署使用文档

概述

使用计算巢,您可以一键秒级部署MMagic 环境,即刻开启MMagic的 AIGC之旅。不使用计算巢,您可能需要花费数小时、甚至更长的时间在环境准备、服务部署上。基于计算巢可以极大提升你的工作效率,把精力集中在业务算法逻辑之上。

MMagic (Multimodal Advanced, Generative, and Intelligent Creation) 是一个供专业人工智能研究人员和机器学习工程师去处理、编辑和生成图像与视频的开源 AIGC 工具箱。 MMagic 允许研究人员和工程师使用最先进的预训练模型,并且可以轻松训练和开发新的定制模型。 MMagic 支持各种基础生成模型,包括:

  • 无条件生成对抗网络 (GANs)
  • 条件生成对抗网络 (GANs)
  • 内部学习
  • 扩散模型
  • 还有许多其他生成模型即将推出!

MMagic 支持各种应用程序,包括:

  • 图文生成
  • 图像翻译
  • 3D 生成
  • 图像超分辨率
  • 视频超分辨率
  • 视频插帧
  • 图像补全
  • 图像抠图
  • 图像修复
  • 图像上色
  • 图像生成
  • 还有许多其他应用程序即将推出!

实例说明

MMagic部署的为社区开源版本,源码参考Github Repo,目前可以选择的实例规格如下:

规格族 vCPU与内存 系统盘 GPU/FPGA
ecs.gn7i-c16g1.4xlarge 16 vCPU 60 GiB 200G 1 * NVIDIA A10 (24G)
ecs.gn7i-c32g1.8xlarge 32 vCPU 188 GiB 200G 1 * NVIDIA A10 (24G)
ecs.gn7i-c32g1.16xlarge 64 vCPU 376 GiB 200G 2 * NVIDIA A10 (24G)
ecs.gn7i-c32g1.32xlarge 128 vCPU 752 GiB 200G 4 * NVIDIA A10 (24G)

预估费用在创建实例时可实时看到。

部署流程

0. 准备工作

在正式开始使用前,您需要一个阿里云账号,对ECS、VPC等资源进行访问和创建操作。

  • 若您使用个人账号,可以直接创建服务实例
  • 若您使用RAM用户创建服务实例,且是第一次使用阿里云计算巢
  • 需要在创建服务实例前,对使用的RAM用户的账号添加相应资源的权限。添加RAM权限的详细操作,请参见为RAM用户授 权。所需权限如下表所示。
  • 且需要授权创建关联角色,参考下图,选中 同意授权并创建关联角色

1. 部署入口

您可以在阿里云计算巢自行搜索,也可以通过下述部署链接快速到达。 部署链接

2. 创建服务实例

点击创建连接: img.png 点击「确认订单」进入:

img_1.png

确认订单信息后,点击「立即创建」: img_18.png

img_19.png 等待服务实例状态为「已部署」后点击前面实例ID链接,进入服务实例详情页面:

img_20.png

点击「登录地址」,进入文件浏览器:

img_21.png

输入创建服务实例输入的用户名和密码登录: img_22.png

后续在实例上进行的MMagic 推理示例的结果即可在这里方便查看。

实例演示

执行环境

通过计算巢创建MMagic的服务实例后,需要进入命令行控制台:

img_7.png

点击远程连接:

img_8.png

点击免密登录:

img_9.png

使用默认会话管理登录:

img_10.png

sudo su - # 进入root
docker start mmagic
docker exec -it mmagic /bin/bash
cd data
## run the following example cases

如上的data目录可以通过本机提供的web服务查看,下面演示的内容输出的图片内容,也可以通过浏览器直接查看:

img_11.png

Text-to-Image(文生图)

基于 stable diffusion 模型进行文生图:

python demo/mmagic_inference_demo.py \
        --model-name stable_diffusion \
        --text "A panda is having dinner at KFC" \
        --result-out-dir demo_text2image_stable_diffusion_res.png

img_12.png

controlnet-canny

python demo/mmagic_inference_demo.py \
        --model-name controlnet \
        --model-setting 1 \
        --text "Room with blue walls and a yellow ceiling." \
        --control 'https://user-images.githubusercontent.com/28132635/230297033-4f5c32df-365c-4cf4-8e4f-1b76a4cbb0b7.png' \
        --result-out-dir demo_text2image_controlnet_canny_res.png

img_13.png

controlnet-pose

python demo/mmagic_inference_demo.py \
        --model-name controlnet \
        --model-setting 2 \
        --text "masterpiece, best quality, sky, black hair, skirt, sailor collar, looking at viewer, short hair, building, bangs, neckerchief, long sleeves, cloudy sky, power lines, shirt, cityscape, pleated skirt, scenery, blunt bangs, city, night, black sailor collar, closed mouth" \
        --control 'https://user-images.githubusercontent.com/28132635/230380893-2eae68af-d610-4f7f-aa68-c2f22c2abf7e.png' \
        --result-out-dir demo_text2image_controlnet_pose_res.png

img_14.png

Image Translation(图像翻译)

python demo/mmagic_inference_demo.py \
        --model-name pix2pix \
        --img ./resources/input/translation/gt_mask_0.png \
        --result-out-dir demo_translation_pix2pix_res.png

img_15.png

Image Super-resolution (图像超分)

python demo/mmagic_inference_demo.py \
        --model-name esrgan \
        --img ./resources/input/restoration/0901x2.png \
        --result-out-dir demo_restoration_esrgan_res.png

img_16.png

通过图像超分之后得到的超分图像信息如下:

img_17.png

更多示例

更多示例请参考文件浏览器的 README.md

其中也包含视频处理相关的,期待您更深入的探索,也欢迎一起实践并补充相应案例到本文档。

参考

© 2009-2022 Aliyun.com 版权所有