twitter 拳交 OpenAI掀翻AI生图郁勃：“吉卜力”动漫风陷版权争议，实测汉文渲染遇瓶颈

2025-03-30 13:27 点击次数：92

（原标题：OpenAI掀翻AI生图郁勃：“吉卜力”动漫风陷版权争议twitter 拳交，实测汉文渲染遇瓶颈）

图片起首：视觉中国

蓝鲸新闻3月29日讯（记者朱俊熹）梦核格调的小猫、“打工东说念主”版的Hello Kitty、一键Jellycat……你对这些AI生成的图片确定不生分，它们曾火遍全网，但当今都照旧过期了。这几天占据海表里各大酬酢媒体首页的，是另一类新的AI生图格调：吉卜力动漫风。

本周早些时候，OpenAI对ChatGPT的图像生顺利能进行了升级，用户不错通过其多模态大模子GPT-4o来生成和修改图像。在3月26日的直播中，OpenAI CEO Sam Altman和团队展示了如安在ChatGPT中把一张自拍照疗养为动漫格调的图片。不雅看者们很快发现，其画风与日本吉卜力动画职责室极为一样，并运行在互联网上自觉体验、传播。一位用户以至将这称作OpenAI模子的“第一次病毒式传播”。

图片起首：Sam Altman X

因涌入的体验者过多，OpenAI决定推迟向免用度户洞开这一图像生成器具的时候。Sam Altman在酬酢平台X上发帖称，“咱们的GPU将近炸了”。他不仅将头像换成了吉卜力格调剪辑后的个东说念主照，还自嘲说念，“为了创造超等智能勇猛了十年，前七年半真的没东说念主情态，之后两年半各人因为多样事报怨我。有一天醒来收到了成百上千条信息：‘看，我把你作念成了一个吉卜力格调的帅小伙’。”

图片起首：Sam Altman X

AI生成“格调”涉侵权吗？

然则当AI生成的“吉卜力”图片马上充斥互联网，一个担忧也随之而起：这是否会触及到对吉卜力职责室动漫作品版权的侵扰？更引东说念主关注的是，吉卜力职责室的结伴创办东说念主、动画师宫崎骏早在2016年就抒发过对AI生成实质的不悦。他在看到一段由AI生成的视频片断时直言，“我感到荒谬恶心，毫不会但愿把这种技艺融入我的作品中。”

OpenAI发言东说念主则暗意，ChatGPT闭幕“以个别活跃艺术家的格调进行生成”，但允许生成“更平时的职责室格调”。

关于其中可能牵扯的版权争议，江苏剑桥颐华讼师事务所讼师、专利代理师杨卫薪告诉蓝鲸新闻，一般情况下“格调”是莫得著述权的，因为它只保护具体的抒发，而不保护想想。“但是要是生成的实质和吉卜力内部的变装或者场景有较高的一致性，那可能就会组成侵权。”

杨卫薪讼师补充称，从GPT-4o在生成吉卜力格调图像上的弘扬来看，模子在检会形状必使用到了吉卜力职责室的作品素材，“否则大模子是没法伙同这种图片格调并进行相应的生成。”要是按照中国的著述权法来看，AI抓取素材用于检会并进行实质生成，是一种侵扰复制权、信息收集传播权的行为，但目放学界和业界都想将这种行为往合理使用的地方鼓吹。

一句话生图成推行

使用AI生成图片并不是清新事，OpenAI这次在功能上的更新大要引起形状级传播，一大原因照旧在于其生成图片的高质地。

据OpenAI先容，GPT-4o模子具备较强的文本渲染智商。蓝鲸新闻记者实测发现，4o不仅不错归附原图的笔墨实质，也守旧通过当然谈话的描写，来调整笔墨的位置或样貌等细节。但该模子对英笔墨符的渲染准确度要高于中笔墨符，在实测过程中会出现将简体字剪辑成繁体字，或生成的中笔墨符出错的情况。OpenAI也承认，4o模子在渲染非拉丁谈话时可能会碰到贫乏。

图片起首：蓝鲸新闻

此外，GPT-4o在图像一致性方面也获得了较猛进展。即使经过多轮对话的调整，其生成的图像在格调、主体外不雅等方面也能保持一致。这大要极地面进步AI生图在游戏瞎想、告白制作等限制的落地可能。

图片起首：蓝鲸新闻

据OpenAI先容，此前其推出的AI生图模子Dall-E是扩散模子，而4o图像生成是一个自转头模子。4o系统会按照从左到右、从上到下的轨则慢慢生成图像，雷同于文本的书写形势，而不是像扩散模子那样，一次性生成悉数这个词图像。

AI创企深势科技的AI算法负责东说念主柯国霖在酬酢媒体上分析称，这体现了用自转头模子来谐和多模态这一有盘算推算的上风。Dall-E是在隐空间中将图像与谈话对王人，在生成图像时，模子不断在文本和图像之间进行互相疗养。但这一过程势必是有损的，图像的教授智商很弱，生成的速即性大、难以精细限制。

柯国霖暗意，像GPT-4o这类Omni Model（万能模子），大要将对话中的图像、文本以至更多模态谐和瞥化为一维token序列，平直通过自转头的形势输入给模子。这么就无需再依赖文本看成桥梁，幸免了信息的半途蚀本。更要道的是，模子每次都能保留圆善的图像信息，因此大要把柄用户辅导，对图像实质进行更清雅、更可控的调整。

关于更多用户而言，GPT-4o这次更新带来的惊喜还体当今使用经过的丝滑度上，让“一句话生图”、“用嘴改图”的可行性直线拉升。相较而言，此前主流的AI生图器具Stable Diffusion对使用者的专科智商条目较高，需要掌抓不同插件及参数的配置。而Midjourney在可控性和一致性方面较弱，不适用于条目高度一致性的任务。

瞎想师章萧醇在酬酢平台X上直言，GPT-4o的图像智商平直推翻了之前许多创业公司的家具。“他们花了那么多时候、东说念主力、投资东说念主的钱去调优的算法、职责流、模子，平直被一次大模子的更新就取代了。”

GPT-4o模子于旧年5月崇拜推出，主打的即是具备大要处理文本、音频和图像的多模态智商，与现时备受瞩目的o1等推理模子有所不同。但在近一年的时候内，4o都未向用户放开其图像生顺利能。

3月28日twitter 拳交，GPT-4o再迎部分更新，包括更擅长解任详备的辅导、提高了惩处复杂技艺和编码问题的智商。Sam Altman预报称，“更多更新行将到来。”

栏目分类

热点资讯

第四播播

twitter 拳交 OpenAI掀翻AI生图郁勃：“吉卜力”动漫风陷版权争议，实测汉文渲染遇瓶颈