XuJing's Blog

大模型平台全解析：小白入门指南

发表于 2024-03-21 更新于 2025-01-19 分类于技术学习， AI入门阅读次数：评论次数：

本文将全面介绍主流AI大模型平台，帮助小白快速了解和选择适合自己的平台，包括HuggingFace、ModelScope、Civitai等平台的特点、使用方法和选择建议。

阅读全文 »

AI人像生成模型学习笔记

发表于 2024-03-21 更新于 2025-01-19 分类于技术学习， AI绘画阅读次数：评论次数：

本文记录了学习和使用AI人像生成模型的经验，包括主流模型介绍、实践工具准备、关键参数设置以及常见问题解决方案等内容。适合想要入门AI人像生成的新手参考。

阅读全文 »

零基础教程：如何在本地搭建AI人像生成模型

发表于 2024-01-18 更新于 2025-01-19 分类于 AI技术阅读次数：评论次数：

写在前面

随着AI技术的迅猛发展，越来越多的创作者开始关注如何在本地部署AI模型。本文将以目前最流行的人像生成模型为例，手把手教你如何在自己的电脑上搭建AI创作环境。不管你是完全的新手，还是已经有一些经验的开发者，这篇文章都能帮你快速入门。

为什么要本地部署AI模型？

在开始动手之前，我们先来聊聊为什么要在本地部署AI模型：

更好的隐私保护：所有数据都在本地处理，不用担心隐私泄露
更低的使用成本：无需支付在线服务费用
更灵活的定制空间：可以自由调整模型参数和训练方式
更快的处理速度：本地GPU直接计算，无需等待在线队列

基本概念解析

在开始动手之前，先来了解几个关键概念：

什么是大模型？

大模型（Large Language Model，简称LLM）指的是具有海量参数的人工智能模型。比如目前流行的Stable Diffusion就是一个典型的图像生成大模型，它包含了数十亿个参数。

什么是人像生成模型？

人像生成模型是专门用于生成人物图像的AI模型。它通过学习大量人物照片的特征，能够根据文字描述生成逼真的人像。

什么是CUDA和cuDNN？

CUDA：NVIDIA开发的并行计算平台，让GPU能够进行通用计算
cuDNN：深度神经网络加速库，专门优化深度学习运算

硬件要求

在开始搭建之前，请确保你的电脑满足以下基本要求：

必需配置

GPU：NVIDIA显卡（最低GTX 1660 6GB）
内存：至少16GB RAM
存储：至少500GB可用空间（SSD推荐）
CPU：建议Intel i5/AMD Ryzen 5以上

搭建步骤

1. 环境准备

首先需要安装以下基础软件：

1
2
3

# 安装Python（建议3.8或以上版本）
# 安装CUDA Toolkit
# 安装cuDNN

2. 安装依赖库

# 创建虚拟环境
python -m venv sd-env
source sd-env/bin/activate  # Linux/Mac
sd-env\Scripts\activate     # Windows

# 安装必要的Python库
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install transformers diffusers accelerate

3. 下载模型

主流的人像生成模型可以从以下平台下载：

Hugging Face
- Stable Diffusion
- DALL-E Mini
Civitai
- Realistic Vision
- majicMIX realistic

4. 运行模型

以Stable Diffusion为例，这是一个基本的运行示例：

from diffusers import StableDiffusionPipeline
import torch

# 加载模型
model_id = "CompVis/stable-diffusion-v1-4"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

# 生成图像
prompt = "a portrait of a young woman with blue eyes, photorealistic, highly detailed"
image = pipe(prompt).images[0]
image.save("portrait.png")

常见问题解决

1. CUDA相关错误

确保NVIDIA驱动是最新版本
检查CUDA版本与PyTorch版本是否匹配
使用nvidia-smi命令检查GPU状态

2. 内存不足

使用torch.float16代替torch.float32减少内存占用
降低生成图像的分辨率
关闭不必要的后台程序

3. 生成质量问题

优化提示词
调整采样步数和方法
使用更好的基础模型

进阶优化

1. 提高生成速度

# 启用注意力优化
pipe.enable_attention_slicing()
# 启用VAE切片
pipe.enable_vae_slicing()

2. 降低显存占用

1
2
3

# 使用xformers优化
pip install xformers
pipe.enable_xformers_memory_efficient_attention()

参考资源

官方文档
社区资源
- Stable Diffusion WebUI
- r/StableDiffusion
模型下载
- Civitai
- Hugging Face Models

总结

本地部署AI模型虽然需要一定的硬件投入和技术基础，但带来的好处是显而易见的。通过本文的指导，相信你已经对如何搭建本地AI环境有了基本的认识。记住，实践是最好的学习方式，动手尝试才能发现更多的可能性。

未来展望

随着硬件性能的提升和模型优化技术的发展，在本地运行AI模型将变得越来越容易。我们可以期待：

更低的硬件门槛
更快的处理速度
更好的生成质量
更多的应用场景

欢迎在评论区分享你的搭建经验！如果遇到问题，也可以留言讨论。如果这篇文章对你有帮助，别忘了点赞收藏哦～

小白必看：2024年最新AI人像模型完全指南

发表于 2024-01-18 更新于 2025-01-19 分类于 AI技术阅读次数：评论次数：

写在前面

大家好！今天我们来聊一聊目前最火热的AI人像模型。不管你是完全的新手，还是对AI绘画有一点了解，这篇文章都能帮你快速掌握当前主流的人像模型。

什么是AI人像模型？

简单来说，AI人像模型就是专门用来生成人物图像的AI模型。你只需要输入文字描述（比如”一个戴着墨镜的年轻女孩”），模型就能帮你生成相应的图像。这些模型经过了大量人物照片的训练，能够理解人物的面部特征、表情、姿势等细节。

2024年AI人像模型排行榜

根据Civitai平台的下载量、评分和用户反馈，以下是当前最受欢迎的人像模型排行：

写实系列TOP3

Realistic Vision 5.1
- 下载量：100万+
- 特色：超高清晰度，真实感强
- 适合：专业摄影作品、商业人像
Photon
- 下载量：80万+
- 特色：完美的光影效果，质感细腻
- 适合：艺术写真、时尚大片
AbsoluteReality
- 下载量：70万+
- 特色：自然真实的肤质表现
- 适合：日常写真、生活照

写实系列作品特点

Realistic Vision 5.1的作品以超高清晰度和真实感著称,特别擅长还原自然的光影和皮肤质感
Photon模型生成的作品光影效果出众,非常适合时尚人像创作

二次元系列作品特点

majicMIX realistic的作品完美融合了真实与二次元风格,人物形象既有写实感又保留动漫特色
Counterfeit生成的作品线条优美流畅,是纯粹的动漫风格代表

混合风格作品特点

Deliberate v3的作品风格多变,能够根据提示词生成不同艺术风格的人像
DreamShaper特别擅长创意构图和光影效果,适合概念艺术创作

注：以上提到的所有模型都可以在Civitai官网找到。你需要先注册Civitai账号,然后就可以免费下载这些模型了。

提示词参考

以下是生成上述示例图片使用的关键提示词：

Realistic Vision 5.1示例：

1
2

a beautiful young woman, professional portrait, natural lighting, detailed skin texture, 8k uhd, professional photography
Negative: deformed, bad anatomy, disfigured, poorly drawn face, mutation, extra limb

majicMIX realistic示例：

1 2	masterpiece, best quality, 1girl, solo, looking at viewer, detailed eyes, anime style, casual wear Negative: bad anatomy, bad hands, missing fingers, extra digit, fewer digits

Deliberate v3示例：

1 2	cinematic portrait of a young woman, artistic lighting, moody atmosphere, detailed facial features, high fashion Negative: bad quality, blurry, distorted features, bad composition

DreamShaper示例：

1 2	creative portrait, fantasy elements, ethereal lighting, flowing hair, detailed environment, magical atmosphere Negative: ugly, deformed, low quality, blurry, bad art

进阶提示词技巧

场景氛围营造：

1	golden hour lighting, soft shadows, bokeh background, depth of field, atmospheric

服装细节强化：

1	detailed clothing, fabric texture, flowing dress, intricate patterns, fashion photography

面部细节增强：

1	porcelain skin, detailed eyes, catch lights, natural makeup, defined features

艺术风格定义：

1	oil painting style, watercolor effects, digital art, concept art, editorial photography

这些示例图片来自Civitai平台的模型展示页面，你可以访问以下链接查看更多示例：

Realistic Vision 5.1: https://civitai.com/models/4201/realistic-vision-v51
majicMIX realistic: https://civitai.com/models/43331/majicmix-realistic
Deliberate v3: https://civitai.com/models/4823/deliberate-v3
DreamShaper: https://civitai.com/models/4384/dreamshaper

目前最受欢迎的人像模型

1. Realistic Vision（写实系列）

特点：超强的真实感，适合生成照片级别的人像
适用场景：证件照、艺术照、人物写真
优势：面部细节精致，皮肤质感自然

2. majicMIX（魔法系列）

特点：动漫风格与现实风格的完美结合
适用场景：二次元人像、时尚插画
优势：高度还原动漫风格，同时保持真实感

3. Deliberate（精致系列）

特点：细节丰富，画面精致
适用场景：各类人像创作，特别适合精修照片
优势：画面质感细腻，构图优秀

如何选择适合自己的模型？

新手入门：建议从Realistic Vision开始，因为：
- 生成效果稳定
- 对提示词要求不高
- 失败率较低
二次元爱好者：推荐使用majicMIX系列，因为：
- 动漫风格优秀
- 人物比例协调
- 面部细节精致
专业创作者：可以尝试Deliberate，因为：
- 可控性强
- 支持复杂场景
- 细节表现出色

使用技巧

提示词技巧：
- 描述要具体（如：不要只说”漂亮女孩”，要说”穿着白色连衣裙的年轻女孩，长发飘飘”）
- 加入场景描述（如：阳光、室内、街道等）
- 注明风格（如：电影感、日系、韩系等）
常见问题解决：
- 手指变形：添加”perfect hands”等提示词
- 面部不自然：使用”beautiful face”、”detailed face”等提示词
- 构图问题：指定”portrait photo”、”upper body shot”等构图要求

未来展望

AI人像技术正在飞速发展，未来我们可能会看到：

更自然的面部表情
更准确的人体姿态
更强的场景互动能力
更好的细节控制

总结

选择合适的人像模型是AI绘画入门的重要一步。建议新手从基础模型开始，慢慢尝试不同风格，找到最适合自己的创作方式。记住，练习和经验积累才是提高出图质量的关键。

参考资源

Civitai模型网站
Hugging Face社区
ModelScope魔搭社区

欢迎在评论区分享你的使用心得！如果这篇文章对你有帮助，别忘了点赞收藏哦～

Transformer

Question

freq bias 需要梯度吗

1 2	with torch.no_grad(): self.freq_bias = FrequencyBias(cfg.TRAIN.DATASETS[0])

IRT_Seminar_Note_1

发表于 2020-10-23 更新于 2025-01-18 分类于小项目阅读次数：评论次数：

我还没写完呢

阅读全文 »

Scene Graph Generation Note 1

发表于 2020-10-21 更新于 2025-01-18 分类于学习笔记，计算机视觉阅读次数：评论次数：

本文记录一下Hiwi的相关笔记。

阅读全文 »

Scene Graph Generation Note 3

发表于 2020-10-21 更新于 2025-01-18 分类于学习笔记，计算机视觉阅读次数：评论次数：

本文记录一下Hiwi的相关笔记, 第三部分。

阅读全文 »

写在前面

为什么要本地部署AI模型？

基本概念解析

什么是大模型？

什么是人像生成模型？

什么是CUDA和cuDNN？

硬件要求

必需配置

推荐配置

搭建步骤

1. 环境准备

2. 安装依赖库

3. 下载模型

4. 运行模型

常见问题解决

1. CUDA相关错误

2. 内存不足

3. 生成质量问题

进阶优化

1. 提高生成速度

2. 降低显存占用

参考资源

总结

未来展望

写在前面

什么是AI人像模型？

2024年AI人像模型排行榜

写实系列TOP3

写实系列作品特点

二次元系列作品特点

混合风格作品特点

提示词参考

进阶提示词技巧

目前最受欢迎的人像模型

1. Realistic Vision（写实系列）

2. majicMIX（魔法系列）

3. Deliberate（精致系列）

如何选择适合自己的模型？

使用技巧

未来展望

总结

参考资源

Transformer

Question