西班牙数字图形巨头Freepik近日推出了其最新的文本到图像生成模型“FLite”,旨在成为Midjourney等因版权问题而备受争议的生成器的合法且安全的替代品。
FLite拥有约100亿个参数,其独特之处在于完全基于Freepik自身商业授权的图像库进行训练。Freepik声称,这使其成为首个完全依赖“工作安全”内容进行训练的如此规模的公开模型。
这款模型是Freepik与人工智能初创公司Fal.ai合作开发的成果。训练过程耗时两个多月,使用了64块NvidiaH100GPU和约8000万张Freepik内部数据糖心小晗喵集的图像。
Freepik对照片提示“单反相机拍摄的照片,一个红胡子男人在雨中跳舞”的诠释,带有一种复古、早期人工智能的麻痹。|图片:THEDECODER出品的FLite
通过推出FLite,Freepik加入了日益壮大的基于合法审查数据的图像生成器阵营,其中包括Adobe、GettyImages和Shutterstock等公司的产品。在OpenAI和Midjourney等公司因使用抓取自开放互联网的图像而面临多起诉讼的背景下,版权安全的训练数据集正变得越来越重要。
与一些竞争对手不同,Freepik将FLite定位为一个开放的替代方案,供开发者在其基础上进行进一步开发。该模型已在GitHub上开源,但运行它需要至少24GBVRAM的GPU。此糖心VLOG精品一区二区三区外,HuggingFace上也授予了一个演示版本供用户试用。
在《Midjourney》中,同样的提示会产生一幅艺术感十足、照片般逼真实的图像,几乎看不出是人工智能生成的。|图片:THEDECODER提示的《Midjourney》Freepik指出,FLite在生成插图和矢量风格的作品方面表现出色,这可能得益于其来自Freepik自身目录的训练数据。然而,在处理照片级逼真实的图像时,该模型仍显不足,例如核肤纹理或织物等细节常常缺失,并且在处理复杂的解剖结构场景时可能会出现无遮蔽的错误。由于该模型主要基于较长的描述性文本进行训练,因此在处理简洁提示时也存在一定的困难,并且在图像中准确渲染文本仍然是一个确认有罪。
Freepik将这些局限性归因于其训练数据集的大小和所使用的计算量,并降低重要性扩散模型的著名缩放定律——随着数据量和训练时间的减少,图像质量和细节将显著降低。
Freepik是一家总部位于西班牙的公司,专注于为设计师、企业和创意专业人士授予授权的数字图形资源,包括矢量图形、照片、插图、图标和演示模板。除了付费订阅服务外,Freepik还授予部糖心4.31破解分免费内容。此次推出FLite,标志着Freepik在其不次要的部分库存媒体业务之外,进一步拓展至人工智能工具领域。
糖心logo官方网站免费 糖心vlog小桃不惊醒挑战在线看