AI视野：百度推千帆SDK开源版本；美图推出“AI封面”功能；支付宝上线AI写真功能；三星发布生成式AI模型、传媒热点、传媒资讯、苏州钰尚传媒-商业品牌企业运营服务商

AI视野：百度推千帆SDK开源版本；美图推出“AI封面”功能；支付宝上线AI写真功能；三星发布生成式AI模型

te4r546

2023-11-08 14:36:28

🤖📈💻💡大模型动态

百度智能云千帆大模型平台推出千帆SDK开源版本

百度智能云升级推出免费开源的千帆SDK，包括数据集管理、模型训练、模型评估、服务部署等功能，助用户轻松构建大语言模型应用。

具体操作指引可点击链接查看:

https://github.com/baidubce/bce-qianfan-sdk/blob/main/cookbook/console-finetune/console-finetune.ipynb

【AiBase提要:】
🌟 升级免费SDK:百度智能云推出千帆SDK，全面开源，提供从数据管理到模型应用的全流程支持。
🚀 多功能应用:SDK支持对话补全、续写补全、语义向量等多种应用，助力用户开发大型语言模型应用。
📚 丰富资源:SDK提供实践案例、应用场景的cookbook，扩展了大语言模型应用的基础能力。

三星发布生成式AI模型Samsung Gauss

三星于2023年11月7日首次公开发布了生成式AI模型Samsung Gauss，旨在将其应用于未来的产品，包括语言、代码和图像模型，提高工作效率和用户体验。

【AiBase提要:】
🔹 三星首次公开发布生成式AI模型Samsung Gauss，用于未来产品。
🔹 Samsung Gauss包括语言、代码和图像模型，提高工作效率和设备控制。
🔹 三星致力于通过自己的AI红队确保AI的安全使用，保护消费者隐私。

思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0

思谋科技发布了全球首个工业多模态大模型 IndustryGPT V1.0，具备深度行业洞察和精炼数据，可应对制造业问题、识别工业缺陷，并与跨国企业合作推动智能制造进入新时代。

AiBase提要:
1. 🚀 思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0。
2. 🏭 这一大模型通过深度行业洞察和精炼数据，解答制造业问题、识别工业缺陷，并提供决策支持。
3. 🤝 思谋科技与跨国企业签署战略合作协议，共同推动全球工业制造进入智能时代。

🤖📱💼AI应用

美图旗下开拍APP推出“AI封面”功能

美图旗下开拍APP推出“AI封面”功能，利用智能生成技术根据图片和文案，帮助视频创作者更高效地制作爆款封面，包括图文生成和视频生成封面，同时支持文案润色。

微信截图_20231108113216.png

【AiBase提要】:
1. “AI封面”是美图公司推出的功能，可以根据图片和文案智能生成视频封面，提高视频创作者的创作效率。
2. 用户只需上传照片和输入封面文案，系统即可生成十款爆款封面，并支持智能优化字体颜色、边框等，满足个性化需求。
3. 对于不擅长写封面文案的创作者，该功能还提供AI文案润色服务，降低了封面制作门槛。

支付宝上线新功能:免费生成AI写真还可导出高清图

支付宝推出免费AI写真功能，用户可生成多种风格的照片，还支持导出高清图，并允许指定生成不同性别的自己。

支付宝上线新功能：免费生成AI写真还可导出高清图

【AiBase提要】
💡 支付宝新增AI写真功能，限时免费，每日登录可获得10张胶片，1张可生成4张写真。
💡 用户可选择不同风格的写真，包括古风、杂志风、航天员风格等。
💡 支付宝AI写真支持导出高清图，但保存1张照片需要扣除3张胶片。

Google Performance Max推生成式AI广告工具

Google最近推出的Performance Max将AI生成技术引入广告领域，帮助广告商生成高质量的广告内容，包括标题、描述和图像，提供更多的自定义选择和创意自由度。

【AiBase提要:】
🚀 Google Performance Max引入生成式AI广告工具，帮助广告商轻松创建高质量广告内容。
📝 广告代理和企业可以使用文本提示迭代生成广告，提高广告效果，同时避免生成相同的广告元素。
📷 AI驱动的图片编辑功能提供广告资源的图片部分编辑，提高广告吸引力，并简化创意审查流程。

PopSockets推AI定制工具支持用户定制手机壳

智能手机外壳和配件制造商PopSockets推出AI定制工具，使用大型模型引擎，让用户个性化手机壳、手柄和钱包，并奖励最佳AI艺术作品。这一创新利用人工智能技术，提供更多创意可能性。

【AiBase提要】
1. PopSockets的AI定制工具基于大型模型引擎，允许用户个性化手机配件。
2. PopSockets举办竞赛，奖励最佳AI艺术作品，推动创造性。
3. 使用PopSockets Customizer AI，用户可以轻松创建专业照片，为产品添加文本或贴纸，提供独特的设计体验。

Plai Labs推文本到视频生成器PlaiDay

Plai Labs最新推出的PlaiDay是一款文本到视频生成工具，允许用户通过上传自拍照片并输入一些文字，生成个性化的短视频，基于AI平台Orchestra的技术开发。

地址:https://plaiday.io/app/

【AiBase提要】:
📌 Plai Labs推出PlaiDay工具，允许用户生成个性化短视频。
📌 Orchestra平台支持合作和连接的AI工具，不仅限于艺术创作。
📌 Plai Labs的技术为各行业提供AI应用，拓宽了AI技术的应用范围。

📰🤖📢AI新鲜事

Adobe回应有关AI生成加沙爆炸图像的争议

Adobe在拜登总统关于AI潜在社会危害的讲话后，对未标记为AI生成的加沙爆炸图像争议进行了回应。

【AiBase提要:】
💬 Adobe回应争议:Adobe就涉及未标记为AI生成的加沙爆炸图像争议发布声明，强调其库存图像标记要求。
🖼️ 图像争议引发抵制:澳大利亚媒体报道此图像，引发社交媒体上的抵制浪潮，涉及Adobe Stock上的其他逼真加沙图像。
👥 平台受到影响:争议导致库存图像贡献者担忧，认为涌入的生成AI图像损害了Adobe Stock平台，Adobe强调尊重第三方权利。

微软将租用Oracle的GPU超级集群以满足Bing Chat的GPU需求

微软计划将Bing搜索中的机器学习模型部分迁移到Oracle的GPU超级集群，以满足Bing Chat生成式AI聊天机器人的高需求，加强其AI服务。

【AiBase提要:】
🔸 微软与Oracle合作将Bing搜索中的机器学习模型部分迁移到GPU超级集群，以支持Bing Chat的高GPU需求。
🔸 合作旨在提高搜索速度和扩展客户访问，涵盖微软与Oracle在云基础设施领域的合作。
🔸 Oracle的GPU集群提供成千上万的Nvidia A100和H100GPU租赁，以满足微软的计算资源需求。

寒武纪与百川智能完成大模型适配

寒武纪的思元（MLU）云端智能加速卡与百川智能的大模型完成全面适配，加速了大模型从训练到部署的流程，提供了更高性能。

【AiBase提要】
1. 寒武纪思元（MLU）云端智能加速卡成功适配百川智能的大模型，提高了性能。
2. 合作涵盖多领域，包括大语言模型和视觉大模型。
3. 合作计划推动大模型在不同行业和场景的广泛应用。

人类或于2028年推出首个AGI?谷歌DeepMind提6条AGI标准

谷歌DeepMind的Shane Legg团队发布了AGI时间表论文，预测到2028年，有50%的可能性开发出首个AGI，同时提出AGI的6个标准和5个等级。

【AiBase提要:】
📅 AGI时间表:Shane Legg团队预测人类可能在2028年开发出首个AGI，引发广泛关注。
📚 定义标准:论文提出AGI的6个标准，包括性能、通用性、认知任务等，为AGI测评提供指导。
🤖 大语言模型:现代大语言模型已经迈向AGI雏形，展现出元认知能力和广泛任务完成潜力。

投资 Hugging Face 的 IBM 启动5亿美元企业人工智能风险基金

IBM宣布启动5亿美元的风险投资基金，专注于投资人工智能公司，以加速生成式人工智能技术的研究和应用。

【AiBase提要】
🚀 IBM启动5亿美元风险投资基金，专注于人工智能公司。
💡 基金将支持全球企业实现人工智能商业潜力。
🤝 IBM积极投资于Hugging Face等领先人工智能公司。

OpenAI发布ChatGPT更新或导致部分AI初创公司倒闭

OpenAI发布的最新ChatGPT更新可能让围绕PDF分析构建的多家AI公司失去竞争力，引发担忧，尤其是包装器的添加可能影响小型AI初创公司。

ℹ️ 【AiBase提要】:
1️⃣ OpenAI的最新更新引发担忧，特别是包装器的添加，可能影响小型AI初创公司，尤其是那些围绕PDF分析构建的公司。
2️⃣ 这一举措引发了一些公司的担忧，包括Stripe产品负责人Sahar Mor的担忧，他认为这可能导致一些车载人工智能公司倒闭。
3️⃣ OpenAI作为最大的大型语言模型开发者，具备资源来应对监管要求，而规模较小的AI初创公司可能受到监管的抑制。

👨‍💻💡🎯聚焦开发者

清华、中科院、MIT联合提出Co-Pilot人机交互框架

清华、中科院和MIT的科研人员合作研发了Co-Pilot人机交互框架，首次将大语言模型用于辅助驾驶，以描述方式控制车辆行动轨迹，并成功满足乘客的意图。

论文地址:https://www.researchgate.net/figure/Co-Pilot-for-path-tracking-control-The-system-consists-of-three-modules-the-Reference_fig2_374800815

【AiBase提要:】
🚗 首次尝试使用语言模型辅助驾驶，以描述方式控制车辆轨迹。
🤖 Co-Pilot人机交互框架能够理解和满足乘客的意图。
🔬 这项研究揭示了大语言模型在自动驾驶领域的应用潜力，为未来研究提供了方向。

斯坦福大学提出RT-Sketch 手绘轮廓助机器人完成任务

斯坦福大学研究人员提出了RT-Sketch，一种目标导向操作策略，使用手绘草图作为机器人任务规范，改进了视觉任务中的机器人操作。

项目地址:https://rt-sketch.github.io/

【AiBase提要】
📌 RT-Sketch是一目标导向策略，使用手绘草图作为机器人任务规范，提高了任务的准确性。
📌 研究人员使用生成对抗网络将图像转化为草图，构建了训练数据集，使RT-Sketch能够接受不同精细程度的草图作为输入。
📌 RT-Sketch在处理模糊语言目标或视觉干扰时表现出色，为人机交互和机器人技术带来了新可能性。

多模态音乐AI框架Video2Music 为视频生成情感相符的音乐

多模态音乐AI框架Video2Music 利用前沿Transformer模型，根据视频内容生成情感相符的音乐，为视频创作者提供更好的音乐配乐选项。

项目地址:https://github.com/amaai-lab/video2music

【AiBase提要】
🎵 Video2Music使用Transformer架构生成音乐，确保音乐与视频内容匹配。
🎶 利用独特的数据集和验证的转换器模型，捕捉视频中的情感变化并转化为音乐情感表达。
🎥 为用户创造更个性化和情感丰富的音乐与视频体验，为未来音乐和视频领域带来更多可能性。

新NeRF技术: 视频转化为可控制的3D模型

Fraunhofer Heinrich Hertz研究团队引入NeRF技术，将标准RGB视频转化为可控制的3D人体模型，降低数字人物模型制作成本，拓展电影、游戏、虚拟现实等领域的应用可能。

【AiBase提要】:
1. Fraunhofer Heinrich Hertz研究团队使用NeRF技术简化数字人物创建，从标准RGB视频生成可控制的3D人体模型。
2. NeRF技术通过预测光线与场景的交互创造逼真的3D图像，提供新途径实现多角度人物动作。
3. 这项创新有望降低数字人物模型制作成本，对电影、游戏、虚拟现实等领域带来积极影响，拓展应用可能性。

中国研究人员推ControlLLM框架:提升大语言模型处理多模态任务能力

中国的研究人员提出ControlLLM框架，旨在增强大型语言模型处理复杂多模态任务，提高准确性和效率。

【AiBase提要】
🔍 中国研究人员提出ControlLLM框架，用于增强大型语言模型（LLMs）在处理复杂任务中的表现。
🔍 ControlLLM通过任务分解、Thoughts-on-Graph方法和多功能执行引擎提高工具利用的准确性和效率。
🔍 这一创新提高了多模态任务的成功率，使LLMs能够更好地处理包括图像、音频和视频在内的不同信息类型。

（）

免责声明：本站文章部分内容为本站原创，另有部分容来源于第三方或整理自互联网，其中转载部分仅供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对其内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

有帮助

上一篇：直通进博会｜好丽友张晓艳：碳中和产品会越来越受消费者青睐

下一篇：进博面对面｜资生堂梅津利信：坚定投资信心让创新成果在中国“生根”

栏目索引

最新文章

标签云

友情链接

助您迅速提升金融知名...

钰尚传媒：专业安装，...

钰尚传媒：您的视频拍...

男子因妻子总抱怨长期...

友情链接