
网站整体介绍
该网站是GitHub上的RealESRGAN开源项目仓库,由腾讯ARC Lab与中国科学院深圳先进技术研究院联合开发,目标是打造通用图像/视频恢复的实用算法。项目基于经典超分辨率模型ESRGAN扩展,通过纯合成数据训练,解决“真实世界盲超分辨率”问题(即输入图像存在未知退化,如模糊、噪声、压缩 artifacts等),适用于通用场景、动漫图像/视频等多种内容的修复与增强。
核心功能与特色模块
1. 多场景模型库
提供针对不同场景优化的预训练模型,覆盖常见使用需求:
通用图像模型:如`RealESRGAN_x4plus`(默认X4倍超分)、`realesrgeneralx4v3`(轻量小模型,支持降噪平衡);
动漫图像模型:`RealESRGAN_x4plus_anime_6B`(针对动漫插图优化,模型更小、效果更贴合动漫风格);
动漫视频模型:`AnimeVideov3`(专门处理动漫视频,解决视频帧间一致性问题)。
2. 灵活的推理方式
支持3种便捷的推理途径,满足不同用户需求:
在线推理:无需本地安装,可通过[ARC Demo官网](https://arc.tencent.com/en/aidemos/imgRestore)、[Colab笔记本](https://colab.research.google.com/drive/1k2Zod6kSHEvraybHl50Lys0LerhyTMCo?usp=sharing)直接体验;
可执行文件(NCNN):提供Windows/Linux/MacOS的便携二进制文件,无需CUDA或PyTorch环境,直接通过命令行运行(支持Intel/AMD/Nvidia GPU);
Python脚本:灵活调整参数(如`outscale`支持任意输出尺寸、`face_enhance`集成GFPGAN进行面部增强),适合开发者自定义需求。
3. 扩展功能
支持面部增强:集成GFPGAN模型,修复图像中的面部细节;
多格式支持:处理JPG/PNG/WebP等图像格式,输出格式可自定义;
TTA模式(测试时增强):提升结果稳定性(仅限可执行文件)。
快速使用指引
1. 安装依赖(针对Python脚本用户):
要求Python ≥3.7、PyTorch ≥1.7;
安装基础库:`pip install basicsr facexlib gfpgan`,再克隆仓库并安装:
“`bash
git clone https://github.com/xinntao/RealESRGAN.git
cd RealESRGAN
pip install r requirements.txt
python setup.py develop
“`
2. 快速推理示例(Python脚本):
通用图像超分:
“`bash
wget https://github.com/xinntao/RealESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth P weights
python inference_realesrgan.py n RealESRGAN_x4plus i inputs face_enhance
“`
动漫图像超分:
“`bash
wget https://github.com/xinntao/RealESRGAN/releases/download/v0.2.2.4/RealESRGAN_x4plus_anime_6B.pth P weights
python inference_realesrgan.py n RealESRGAN_x4plus_anime_6B i inputs
“`
社区与更新
更新日志:持续迭代功能,如添加轻量模型、动漫视频专用模型、NCNN便携版、Huggingface Spaces集成等;
社区生态:已有多个衍生项目,如Android端`RealSRNCNNAndroid`、视频处理插件`vsrealesrgan`、GUI工具`Waifu2xExtensionGUI`等;
反馈与支持:用户可通过GitHub Issues提交问题,或联系作者邮箱`xintao.wang@outlook.com`。
关键价值
RealESRGAN解决了真实场景中超分辨率的“盲处理”痛点(无需已知退化类型),且通过纯合成数据训练规避了真实数据标注的高成本,是工业界与学术界常用的图像恢复工具,尤其在动漫、监控视频、老照片修复等场景中应用广泛。
相关导航


GitHub – EutropicAI/Final2x: a cross-platform image super-resolution tool

Open SaaS

Lumiere

GitHub – facebookresearch/segment-anything: The repository provides code for running inference with the SegmentAnything Model (SAM), links for downloading the trained model checkpoints, and example notebooks that show how to use the model.

IP-Adapter
![GitHub – text2cinemagraph/text2cinemagraph: Text2Cinemagraph: Text-Guided Synthesis of Eulerian Cinemagraphs [SIGGRAPH ASIA 2023]](https://zaixiandaohang.com/wp-content/themes/onenav/assets/images/favicon.png)
GitHub – text2cinemagraph/text2cinemagraph: Text2Cinemagraph: Text-Guided Synthesis of Eulerian Cinemagraphs [SIGGRAPH ASIA 2023]
