4月4日消息,据Techcrunch报道,几个月前,OpenAI 凭借生成式 AI 模型Sora吸引了科技界的目光,该模型可以将场景描述转化为原始视频,无需摄像机或电影摄制组。但到目前为止,Sora 一直受到严格的限制,该公司似乎将其目标瞄准了好莱坞导演等资金雄厚的创意人士 ,而不一定是业余爱好者或小型营销人员。
Snap 前生成人工智能主管 Alex Mashrabov 察觉到了机遇。因此,他推出了Higgsfield AI,这是一个由人工智能驱动的视频创作和编辑平台,专为更加量身定制、个性化的应用而设计。
Higgsfield 的第一个应用程序 Diffuse 由自定义文本到视频模型提供支持,可以从头开始生成视频或拍摄自拍照并生成由该人主演的剪辑。
「我们的目标受众是各种类型的创作者。」Mashrabov 在接受 TechCrunch 采访时表示,「从想要与朋友一起创作有趣内容的普通用户,到想要尝试新内容格式的社交内容创作者,再到想要自己品牌的社交媒体营销人员脱颖而出。」
Mashrabov 是通过他之前的初创公司AI Factory来到 Snap 的,该公司是 Snap 于 2020 年以 1.66 亿美元收购的。在 Snap 期间,Mashrabov 帮助为 Snapchat 构建了 AR 效果和滤镜等产品,包括Cameos以及 Snapchat 备受争议的MyAI chabot。
Higgsfield——Mashrabov 几个月前与专门研究生成视频的人工智能研究员 Yerzat Dulat 共同推出——提供了一组精心策划的预生成剪辑、一个上传参考媒体(即图像和视频)的工具以及一个提示编辑器,可以让用户描述他们想要描绘的人物、动作和场景。使用 Diffuse,用户可以将自己直接插入到人工智能生成的场景中,或者让他们的数字肖像模仿其他视频中捕捉到的东西,比如舞蹈动作。
「我们的模型支持高度逼真的动作和表情。」马什拉博夫说。 「我们正在为消费者开创世界模型,这将使我们能够构建一流的视频生成和编辑功能,并具有高度的控制能力。」
Higgsfield 并不是唯一一家与 OpenAI 正面交锋的生成视频初创公司。 Runway 是最早进入这一领域的公司之一,而且它的工具还在不断改进。还有 Haiper,它得到了两名 DeepMind 校友的支持和超过 1300 万美元的风险投资现金。
Mashrabov 认为,Diffuse 将因其移动优先、社交化的市场进入战略而脱颖而出。
「通过优先考虑 iOS 和 Android 应用程序而不是桌面工作流程,我们使创作者能够随时随地创建引人注目的社交媒体内容。」Mashrabov 说。 「事实上,通过在移动设备上构建,我们能够从第一天起就优先考虑易用性和消费者友好的功能。」
希格斯菲尔德也在精益运营。 Mashrabov 表示,支撑该平台的生成模型是由 16 人团队在不到 9 个月的时间里开发出来的,并在 32 个 GPU 的集群上进行了训练(32 个 GPU 听起来可能很多,但考虑到 OpenAI 使用了数万个 GPU,这实际上并不算多) )。
Higgsfield 迄今为止仅筹集了 800 万美元,其中大部分来自 Menlo Ventures 牵头的最近一笔种子资金。
为了领先竞争对手一步,希格斯菲尔德计划将种子资金用于构建一款改进的视频编辑器,让用户可以修改视频中的角色和对象,并专门针对社交媒体用例训练更强大的视频生成模型。事实上,马什拉博夫将社交媒体和社交媒体营销视为希格斯菲尔德的主要赚钱利基。
虽然 Diffuse 目前可以免费使用,但 Mashrabov 预计未来营销人员需要支付某种费用或订阅才能获得高级功能,或者批量或大规模的营销活动。
「我们相信希格斯菲尔德为社交媒体营销人员带来了令人难以置信的现实主义和内容制作用例。」他说。 「我们经常听到首席营销官和创意总监表示,他们需要优化内容制作预算并缩短时间,同时仍然提供有影响力的内容。因此,我们相信视频生成人工智能解决方案将成为帮助他们实现这一目标的核心解决方案。」
当然,希格斯菲尔德也不能幸免于生成型人工智能初创公司面临的更广泛的挑战。
众所周知,像 Diffuse 那样的生成式人工智能模型可以反刍训练数据。为什么会出现这样的问题呢?好吧,如果模型在未经许可或某种许可协议的情况下接受版权内容的培训,那么这些模型的用户可能会无意中生成侵犯版权的作品,从而使他们面临诉讼。
马什拉博夫不会透露希格斯菲尔德训练数据的来源(除了说它来自多个公开可用的地方),也不会说希格斯菲尔德是否会保留用户数据来训练未来的模型,这可能与一些商业客户。
他确实指出,Diffuse 用户可以随时通过该应用程序请求删除他们的数据。
正如近几个月社交媒体上深度造假的野火蔓延所表明的那样,像希格斯菲尔德这样的数字克隆平台也容易被滥用。
同样,希格斯菲尔德可以让窃取创作者的内容变得更容易。例如,人们只需要上传某人编舞的视频,就可以生成自己表演相同编舞的视频。
我问马什拉博夫希格斯菲尔德可能会使用哪些保障措施或保护措施来试图防止滥用,尽管他不愿透露具体细节,但他声称该平台采用了自动和手动审核的混合方式。
「我们决定首先在选定的市场逐步推出该产品并进行测试,以便我们可以监控可能存在滥用的情况,并根据需要改进产品,」马什拉博夫补充道。
我们必须等待,看看它在实践中效果如何。