Skip to content

Latest commit

 

History

History
447 lines (226 loc) · 39.8 KB

20231222.md

File metadata and controls

447 lines (226 loc) · 39.8 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计116195 字,简读后为9669字,阅读时间为24分钟,为您提高阅读效率为1208%

  • 免费畅享最佳AI音乐生成器 🎵
  • 医渡科技发布医疗大模型,在多个任务场景中超越GPT 🏥
  • GPT-4:完整注册指南,快来了解! 📘
  • Humane的AI Pin能经受时间考验吗?⌛
  • 大模型风潮一年后,看看2024年的关键焦点是什么? 🚀
  • 鸿蒙、ChatGPT入选全球十大工程成就!🌍
  • AIGC:优化openAI的LangChain使用指南 🚀
  • Mistral成立半年,估值暴涨七倍,开源改变AI战局 🔄
  • GPT-4驱动机器人化学家在Nature上登场,自主设计反应执行复杂实验 🤖
  • AI iPhone前奏?苹果发表解决“手机内存运行大模型”论文 📱

产业资讯

Mistral成立半年,估值暴涨七倍,开源改变AI战局 🔄

要点解析:

  • Mistral AI以开源模型Mixtral 8X7B在A轮融资中跻身20亿美元估值,成为开源大模型领域的亮点。该模型采用专家混合架构,性能优越,超越竞争对手如Meta的Llama和OpenAI的GPT-3.5。

  • 开源与闭源在生成式AI技术领域的较量愈演愈烈。Mistral AI坚持开源理念,认为底层代码应该自由共享,以促进技术的审查和共同改进。开源模型的创新势头日益强大,正在对专有模型发起挑战。

  • 图表显示开源社区项目在生成式AI性能上逐渐迎头赶上专有模型,预示着未来1~2年开源力量可能与专有模型展开更为激烈的竞争。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-11

统信桌面智能助手亮相,UOS AI V1.1版本升级,接入主流大模型 🖥️

要点解析:

  • 12月20日,统信软件在2023操作系统产业大会发布UOS AI V1.1版本,实现了大模型统一管理,应用体验智能升级。新版桌面智能助手支持自然语言交互,覆盖40+场景,包括知识问答和内容创作。同时,支持云侧和端侧模型接入,已有10+应用接入UOS AI,提供全新的编程环境和系统级AI应用开发框架。

  • UOS AI V1.1版本带来了全新升级的桌面智能助手,支持自然语言交互操作,覆盖了打开应用、设置系统功能、创建日程等40+场景,并支持知识问答和内容创作。此外,新版本支持云侧和端侧模型接入,包括国内外主流大模型,丰富了应用生态。目前,已有10+应用通过UOS AI获取AI能力支持,为开发者提供了更便捷的开发环境和接口。

  • 统信软件在生态大会上与智谱、科大讯飞、360集团等大模型生态伙伴签署了“灯塔计划”,旨在共同推动AI技术在各行业的应用和创新发展。这一举措为UOS AI的发展注入了新的合作动力,有望推动国产操作系统在人工智能领域的领先地位。

原文链接:https://www.ithome.com/0/740/795.htm

VAST开创全新通用3D大模型,将3D生成带入「秒级」时代 ⏱️

要点解析:

  • 传统3D建模在多个行业中依赖专业人员,生成式AI技术在2D图像领域的成功启发了对3D建模的潜力。然而,当前市场上的3D生成AI技术仍存在挑战,VAST是一家在这个领域进行突破的初创公司。

  • VAST的研究团队从表示、模型和数据三个方向入手,致力于解决3D生成领域的挑战。通过提出新的动态场景表示方法和探索基于Transformer的3D表示,VAST试图克服3D内容生成的复杂性,寻找通用方法。

  • VAST近期完成了通用3D大模型Tripo的研发,基于千万级别的高质量3D原生数据库。Tripo展现了在生成质量、速度和成功率方面的领先地位,具有巨大的潜力,可能在极短时间内创造高质量的3D作品。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-7

AI Native工程化:百度App AI互动技术实践 📲

要点解析:

  • 随着AI浪潮兴起,大模型在业务重构中发挥关键作用。文章提出一体化Prompt生成、评估与迭代方案,加速大模型与业务结合的速度。

  • 文章深度剖析Prompt工程的生命周期,强调需求分析、数据处理、Prompt设计、测试评估、优化、集成与部署、持续监控的关键步骤。

  • 大模型应用开发实践平台涵盖Prompt测评与发布、QEP集成、数据飞轮构建。平台通过自动化流程、多模型测评、全面优化的Prompt上线流程提高效率。

原文链接:https://juejin.cn/post/7314588301990920231

曙光获双项认可,领航AI时代!🌟

要点解析:

  • 中国经济新闻网报道,中科曙光凭借在人工智能领域的技术创新和应用实践成果,成功入选了“2023人工智能年度领航企业TOP50”。曙光的5A级智算中心也荣获“2023人工智能年度杰出解决方案TOP10”。这标志着曙光在AI产业中的高质量发展受到了权威认可。

  • 量子位揭晓的评选结果基于真实数据和深入调研,旨在为科技创新关注者提供客观视角。曙光长期致力于计算产业,取得了在异构智能计算平台、服务器、大模型一体机和算力基础设施领域的突破性进展。其5A级智算中心在算力供给、算法优化、数据服务和行业应用等领域形成全场景人工智能计算服务。

  • 基于先进的5A级智算中心,曙光打造了全国首个一体化算力服务平台,实现了全国范围内分布资源的整合。该平台提供灵活的算力服务,支持多种模型算法,广泛应用于气象、生物、材料、智能制造等前沿领域。曙光将继续加快自主研发与生态建设,为AI企业高质量发展提供更完善的智算解决方案。

原文链接:http://www.fromgeek.com/daily/1044-619256.html

开源训练集LAION-5B曝光“儿童性虐待内容”,Stable AI紧急声明 🚨

要点解析:

  • 斯坦福大学对开源模型训练数据集 LAION-5B 进行研究,发现其中包含3000项“可疑的儿童性虐待内容”。LAION项目紧急下架LAION-5B,并声称已移除1008项“确凿的相关内容”。

  • LAION-5B数据集总共有58.5亿项图片信息,曾被Stability AI用于训练自家AI模型,提供“文生图服务”。Stability AI回应称其模型使用经过筛选及微调的训练集版本,不会影响模型输出结果。

  • 斯坦福大学指出LAION-5B事件揭示出业界可能存在大量数据集含有不当内容,呼吁模型训练方需谨慎选择“必要的训练数据集”。

原文链接:https://www.ithome.com/0/740/743.htm

美国制定安全AI发展规则 🇺🇸

要点解析:

  • 美国政府着手制定人工智能(AI)发展的综合规则,特别是在拜登政府积极应对AI技术不断演变的背景下。文章解析了最近的行政命令,突出了其影响以及国家对全球AI挑战的回应。

  • 在具有开创性意义的举措中,美国商务部为公众讨论制定AI责任措施开辟了途径。国家电信和信息管理局(NTIA)正主导努力,寻求来自各方的意见,强调需要进行审计和评估,以确保AI系统的可信度。NTIA负责人艾伦·戴维森强调了建立监管措施的紧迫性,他承认AI技术迅速发展。

  • 拜登政府此前推出了自愿准则,类似于“权利法案”,概述了负责任的AI开发原则,包括数据隐私、防范算法歧视和自动系统使用的透明度。同时,联邦机构正在审查现有法规,确定其对AI的适用性,立法者在2021年提出了100多项与AI相关的法案。然而,与欧洲同行相比,联邦对迅速发展的技术的历史性反应滞后是公认的。

  • 拜登总统的行政命令在AI治理领域是一项具有里程碑意义的发展。该命令为AI安全和安全制定了新的标准,解决了与国家安全、公共卫生和经济福祉相关的问题。关键指令包括安全测试结果的强制共享、为AI系统制定标准和测试,以及建立AI安全与安全委员会。这些措施代表了确保负责任地开发和部署AI技术的重大进展。

原文链接:https://www.analyticsvidhya.com/blog/2023/12/us-sets-rules-for-safe-ai-development/

AI保护小狗迎接圣诞,确保狗狗终身幸福 🐾🎄

要点解析:

  • 随着假期季节的到来,购买宠物的需求激增,但人们对利用这一趋势的狗贩子的担忧也在上升。这些狗贩子试图通过在线引人注目的节日广告吸引购物者,但这些广告中展示的小狗往往生病,并可能在一月份之后无法生存,这是英国慈善机构Dogs Trust著名口号的沉痛提醒:“养狗是终身责任,而不仅仅是为了圣诞节”。

  • 为了应对这一令人担忧的趋势,一家宠物转让网站引入了人工智能系统Spotty,以确保狗贩子和虐待动物者无法利用假期对狗的需求。英国Pets4Homes使用Spotty系统,通过图像识别自动检测并屏蔽任何明确将动物与礼物联系在一起的广告。该系统分析图像以检测健康和幸福的指标,例如动物的外貌和压力或忽视的迹象,并能够识别拥挤空间或不卫生条件等环境因素。

  • Pets4Homes还利用光学字符识别(OCR)技术检查涵盖小狗疫苗、犬业俱乐部证书和DNA测试结果的文件的真实性。对话监控方面,Pets4Homes使用简单的自然语言处理(NLP)技术标记潜在的欺诈或不道德交互。该系统还关注金融欺诈,通过统计模型和机器学习识别异常的金融模式,如突然的大额交易或跨多个账户的不寻常支付分布。

原文链接:https://aibusiness.com/verticals/ai-protects-pups-this-christmas-ensuring-dogs-are-for-life

谷歌Gemini技术报告发布,作者多达900余人 📄

要点解析:

  • 谷歌发布的Gemini技术报告揭示了其多模态大模型的独特能力。Gemini Ultra在图像理解基准中表现卓越,刷新了30个基准中的30个,展示出强大的推理和多模态任务能力。该模型从事跨领域任务,如推理、阅读理解、STEM和编码,同时在多语言任务中也展现出卓越性能。

  • Gemini的模型架构包括Ultra、Pro和Nano三个版本,适用于各种任务,从复杂推理到移动设备。Gemini的输入涵盖文本、音频、图片和视频,展现了原生多模态的特性。技术报告详细阐述了Gemini的训练基础设施,使用TPUv5e和TPUv4进行训练,并在多模态和多语言数据集上进行预训练。

  • 谷歌对Gemini的评估显示其在文本、图像、音频和视频基准上实现了新的SOTA水平。Gemini在多模态推理功能上表现强大,能够识别输入内容的细节、跨空间和时间聚合上下文,同时具备多语言理解和生成能力。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-4

再也不怕合照缺人,Anydoor为图片编辑开辟了一道「任意门」 📷

要点解析:

  • 香港大学和阿里巴巴与蚂蚁集团合作的新成果AnyDoor为图像编辑带来革命性突破。该模型实现了对象传送,能将目标对象无缝嵌入场景图像,并在图像合成、效果图渲染、海报制作、虚拟试穿等应用场景中表现出色。

  • AnyDoor的核心思想是用与背景场景交互的身份和细节高度相关的特征表示目标对象。通过ID提取器和频率感知的细节提取器,模型能够准确提取对象身份信息和细节,指导生成所需图像。不仅保证了高保真度,还增强了多样性。

  • 该模型利用视频数据集收集同一对象的图像对,以提高生成对象的泛化性。实验证明,AnyDoor在保真度和数量上具有优势,是图像编辑领域的重要进展。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-3

谷歌推出TpuGraphs训练数据集,优化编译器,强化AI深度学习能力 💻

要点解析:

  • 谷歌推出名为 TpuGraphs 的模型训练数据集,旨在优化编译器,提升AI深度学习能力。当前AI系统主要使用TensorFlow、JAX、PyTorch等框架进行训练,这些框架通过底层编译器的启发式算法来优化模型。TpuGraphs作为一种“学习成本模型”源自各种开源深度学习程序,包括ResNet、EfficientNet、Mask R-CNN和Transformer等热门模型架构。

  • 谷歌 TpuGraphs 数据集相较于业界竞品,其“平均图大小”大了770倍,“图数量”增加了25倍。据谷歌称,应用 TpuGraphs 数据集能有效解决编译器的性能、模型可扩展性、效率和质量等问题。

  • 谷歌还介绍了一种名为 GST(Graph Segment Training)的模型训练方法,允许在RAM有限的设备中训练大型图神经网络。该方法能够加速模型的端到端训练时间3倍,有效提高模型训练效率。

原文链接:https://www.ithome.com/0/740/737.htm

2023年笔记本市场观察:迎接AI新时代的波折经历 📅

要点解析:

  • 2023年,笔记本电脑市场在全球经济波动和技术创新推动下呈现复杂景象。疫情推动数字化和移动化,使笔记本成为增长主力,但随着封控解除,市场遭遇严峻挑战。大模型的出现为PC厂商带来曙光。

  • 2023年第一季度,全球笔记本电脑市场遭遇严重出货量下跌,同比降34%,PC厂商面临危机。联想、惠普领跑,但出货量同比下降,而苹果遭受最严重的销量下滑。第二季度回暖迹象明显,市场逐步复苏。

  • 技术创新放缓,消费者关注转向性价比。市场需求由配置转向价格,性价比高的产品受欢迎。PC厂商调整产品线,推出更具性价比的新品。5G和ARM PC的发展成为市场关注焦点。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8420-30620706.html

GPT-4驱动机器人化学家在Nature上登场,自主设计反应执行复杂实验 🤖

要点解析:

  • 近日,卡内基梅隆大学研究团队以 GPT-4 为基础,提出了一种智能 Agent,被称为 Coscientist,可通过简单语言提示执行整个化学实验过程。这一系统能自主设计、规划和执行复杂科学实验,如湿实验中制备化合物。研究人员展示了 Coscientist 在六项任务中的多功能性,包括规划化合物合成、搜索硬件文档、执行高级命令、控制液体处理仪器、解决复杂科学任务和优化实验数据分析。

  • 该系统利用 GPT-4 强大的语言模型搜索化学文献,设计反应途径,并制定实验计划。Coscientist 在化学合成计划任务中展现出高效的能力,加速了已知分子的合成,包括扑热息痛和阿司匹林。此外,研究人员通过设计游戏测试验证了 Coscientist 的化学推理能力,展示了其在处理现实实验活动中的高效性。

  • 该研究意味着基于大语言模型的人工智能系统在科学领域的潜力巨大,尤其在化学实验设计和执行方面。Coscientist 的出现可能为科学家提供了全新的合作方式,通过人与机器的协同合作加速研究进程,带来新的发现和材料。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-10

4090成A100平替?Token生成速度仅比A100低18%,上交大推理引擎势不可挡 🔥

要点解析:

  • 上海交大团队推出高速推理引擎PowerInfer,能在消费级GPU上高效运行LLM,尤其在NVIDIA RTX 4090上表现卓越。与 llama.cpp 相比,PowerInfer在单个RTX 4090上运行Falocn-40B-FP16模型实现了11倍多的加速,同时保持模型准确性。

  • PowerInfer的设计关键在于充分利用LLM推理中的高度局部性,通过GPU-CPU混合推理引擎实现高速推理。该引擎预加载热激活的神经元到GPU,而冷激活的神经元则在CPU上计算,显著减少GPU内存需求和CPU-GPU数据传输。

  • 实验证明,PowerInfer相较于llama.cpp在不同模型和输入输出配置下都取得了显著的性能提升,平均加速达到8.32 tokens/s,最高峰值达到16.06 tokens/s。该引擎有效支持使用INT4量化压缩的LLM,表现出色。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-5

GPT-4:完整注册指南,快来了解! 📘

要点解析:

  • GPT-4是2022年底OpenAI发布的最新AI模型,作为GPT-3的继任者,它承诺更先进的自然语言处理能力,可生成类似人类的文本,回答问题,总结内容等。

  • 想要使用这个强大的新工具,首先要注册获取访问权限。以下是通过OpenAI注册GPT-4访问的完整指南。

  • 在导航到OpenAI网站,选择GPT-4,加入等待列表,验证身份,添加付款方式后,只需等待获得访问权限即可。

原文链接:https://openaimaster.com/?p=29312

AI标志性里程碑:华尔街用钱投票,开始拥抱大模型 💰

要点解析:

  • 华尔街的大银行,曾以极度吝啬在软件支出上而著称,如今却纷纷倾向于采用大型语言模型和其开发者。据悉,花旗银行、摩根大通和高盛在今年下半年开始广泛应用微软Copilots,利用AI助手整合文档、电子邮件生成、电子表格或PPT制作以及编写代码。许多大型银行还租用专用服务器,用于开发定制化的AI模型。

  • 高盛是其中一家将AI模型主要应用于处理企业财报等数据,为投资决策提供信息的银行。据知情人士透露,高盛在微软云产品上的支出在上半年基本持平,但在下半年增加了20%以上,其中部分费用用于开发自家AI模型。此外,高盛还增加了在微软AI代码辅助工具GitHub Copilot上的支出,试验着由微软开发的简化版模型Phi,用于处理不太复杂的任务。

  • 花旗银行也在积极测试GitHub Copilot,并计划未来扩大采用范围。此外,该银行开始使用微软Azure云服务测试大型AI模型,用于分析监管文件等资料,为投资决策提供信息。这一趋势表明,即便是以成本为重的大银行,也在为微软和OpenAI的产品买单,显示B端AI应用相对成熟,市场前景广阔。

原文链接:https://awtmt.com/articles/3704742

“数智说”工业智能化论坛圆满成功 🌐

要点解析:

  • 12月16日,“数智说”工业智能化论坛在上海举办,邀请专家学者和企业代表共探工业数智化。上海经济和信息化委员会强调智能制造的增长,发布长三角数字化转型试点名单,涵盖多领域企业。中国商飞、中国联通、中交疏浚等分享数字化转型实践,展示了数字技术在工业场景中的推动力。

  • 联想智能制造首席架构师分享数字化转型方法论,以及联想在智能化转型中的实践。节卡机器人CIO介绍柔性智能机器人应用案例,推动“柔性智造”新模式。工业智能应用场景方、数智服务平台代表等围绕“大模型服务”、“人机共融应用”、“数据驱动智能决策”等议题,探讨人工智能赋能新型工业化的高效路径。

  • 数智上海2023峰会以“智能创新赋能产业数字化转型”为主题,吸引政产学研用大咖共同探讨数智技术与产业深度融合。峰会通过多平台同步直播,吸引超过两百万观众在线观看,推动数字化工厂的生态建设。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-9

打造大模型时代的最佳云底座,百度智能云推出三套「组合拳」 🌐

要点解析:

  • 12月20日,百度云智大会・智算大会聚焦大模型引发的云计算变革。百度智能云正在以“云智一体”战略,从底层基础设施到AI原生应用开发进行端到端升级。百度百舸・AI异构计算平台3.0发布,专项优化大模型训练和推理,实现任务训练时长98%以上的效率。百度智能云还发布了新功能,支持多种业务场景的计价方式,满足不同需求。

  • 大模型正推动云计算产业创新变革。在云基础设施层,AI应用对GPU等异构计算需求大幅增加,引领云市场底层算力需求向GPU转变。在模型层,大模型成为通用服务能力,即模型即服务(MaaS),极大降低AI落地门槛。在应用层,大模型的独特能力催生AI原生应用研发新范式,改变整个应用技术栈和业务流。

  • 百度智能云千帆大模型平台是业界领先的MaaS服务平台,提供包括百度文心大模型在内的54个主流基础大模型和行业大模型。千帆平台已累计服务超过4万家企业用户,本次升级发布新功能,包括完善的大模型数据管理工具链和千帆AppBuilder的开放服务,降低大模型训练成本最高可达90%。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-6

大模型风潮一年后,看看2024年的关键焦点是什么? 🚀

要点解析:

  • 2023年,全球大模型产业进入高潮,中国成为仅次于美国的全球第二大大模型产业中心。然而,大模型数量激增,如何实现产业化落地成为当前头号难题。政策支持、巨头关注、资本热情是推动产业快速发展的三大因素。

  • 以度小满、阿里、科大讯飞为代表的企业在大模型产业化方面取得了初步成功。定制化训练参数、深入贴合行业需求,以及普惠开放路线,成为产业化的关键。三个标杆案例:度小满轩辕大模型在金融领域深耕,阿里通义千问大模型实现“AI驱动”电商战略,科大讯飞星火大模型融合教育科技成为标杆玩家。

  • 然而,产业链中的中小企业面临技术门槛较高的问题,头部玩家需要普惠开放路线,让大模型技术惠及更多行业参与者。加速AI技术产品化、产业化和商业化成为2024年大模型行业的重中之重。

原文链接:https://www.ofweek.com/ai/2023-12/ART-201718-8420-30620738.html

鸿蒙、ChatGPT入选全球十大工程成就!🌍

要点解析:

  • 中国工程院发布2023全球十大工程成就,包括中国空间站和鸿蒙操作系统入选。中国空间站完成在轨建设,提供广阔太空探索前景。鸿蒙操作系统首次应用分布式架构,实现跨终端协同操作。

  • OpenAI推出ChatGPT聊天内容存档功能,用户可在网站和iOS使用,提供侧边栏移除聊天内容和浏览存档功能,后续将在安卓系统推出。

  • NewsGuard报告指出,自今年4月以来,人工智能创建的虚假新闻网站激增1100%以上,利用AI技术制造虚假信息,形成肆意妄为的态势。

原文链接:https://juejin.cn/post/7314881190435356684

奥本海默传记作者等作家向OpenAI提起集体版权诉讼 ⚖️

要点解析:

  • 11名非虚构类作家起诉OpenAI和微软,指责滥用他们的书籍训练ChatGPT等AI模型。包括普利策奖获得者Taylor Branch、Stacy Schiff和电影《奥本海默》作者Kai Bird。指控涉及未经授权使用作品、侵犯版权,并要求公平赔偿。

  • 作家团体代表律师表示,被告通过未经授权使用非小说类书籍赚取了数十亿美元,要求作者得到公平赔偿。这是继之前的集体诉讼,作家要求维护他们作品的权益,并引起了版权所有者的广泛关注。

  • 莱斯集体诉讼成为作者维权的新一波浪潮,揭示了AI技术在文学创作中的伦理和法律挑战。作家们希望通过法律手段确保他们的劳动成果得到尊重和合理对待。

原文链接:https://m.cnbeta.com.tw/view/1406075.htm

千亿市值制药CRO巨头,为何需要AI自救? 💊

要点解析:

  • CRO行业在疫情后面临严峻挑战,订单锐减、价格战激烈。AI制药的崛起加剧了传统CRO的困境,尤其是在药物发现环节,AI的高效率威胁着传统CRO的盈利模式。

  • AI制药技术对药物研发的影响主要体现在药物发现阶段,借助人工智能辅助药物设计(AIDD)的强大预测能力,缩小了候选化合物范围,降低了成本。然而,CRO机构需适应AI的加入,拓展服务链条以保持竞争力。

  • 传统CRO企业积极应对AI挑战,通过招募AI人才、自建AI团队,以及收购小型AI CRO公司等方式,将AI纳入自身工具,提升服务水平,同时也在面临与AI制药公司合作与竞争的复杂局面中谋求生存之道。

原文链接:https://www.leiphone.com/category/shengwuyiyao/Em5uqLm4wKvXLhyP.html

AI iPhone前奏?苹果发表解决“手机内存运行大模型”论文 📱

要点解析:

  • 苹果最近发布的论文介绍了一种在有限内存设备上运行大语言模型(LLM)的方法,超越可用DRAM容量。这项研究支持有限容量设备运行内存是原来两倍大小的LLM,同时显著提升GPU的推理速度。通过提高内存使用效率,这项突破性研究将生成式AI集成到iOS 18的计划中,可能大幅提升设备性能。

  • 论文建构了基于闪存的推理成本模型,优化了两个关键领域:减少从闪存中传输的数据量和更流畅地读取数据块。这一框架将模型参数存储在闪存中,实现了在LLM运行时处理超过DRAM可用容量的数据量。具体采用的技术包括“窗口化”技术和“行列捆绑”技术,使得苹果能够在有限内存下最大化LLM的适用性。

  • 苹果的这一技术突破对于在资源有限的环境中部署先进的LLM至关重要。研究结果显示,与传统加载方法相比,该框架支持DRAM两倍大小的模型,在CPU和GPU中推理速度分别提升4-5倍和20-25倍,大大提高了内存使用效率。

原文链接:https://m.cnbeta.com.tw/view/1406015.htm

只需一张图片、一句指令,Animate124轻松生成3D视频 🎥

要点解析:

  • 近一年来,DreamFusion引领了3D静态物体与场景生成潮流,技术从文本生成逐步发展到整合多种控制信号的3D动态场景生成。Meta推出MAV3D标志着基于文本生成3D视频的初步尝试,但进展较慢。现有基于图文结合的3D视频生成技术Aniamte124已问世。

  • Animate124模型由新加坡国立大学(NUS)和华为的研究团队提出,结合单张图片和动作描述,实现了对3D视频生成的精准控制。其方法包括静态生成、动态粗糙生成和语义优化三个阶段,使用多种扩散模型进行监督和引导,最终生成高质量3D视频。

  • Animate124是首个根据文本描述将任意图片变成3D视频的方法,采用图文结合、语义优化等技术。实验证明,在CLIP和人工评价上,Animate124相比两个baseline模型和MAV3D均取得更好的效果。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-2

产品介绍

AIGC:优化openAI的LangChain使用指南 🚀

要点解析:

  • 使用LangChain和OpenAI优化openAI,提高开发速度。通过Google Colab简化环境配置,实现无忧运行Python代码和访问云端计算资源。在此基础上,介绍了如何获取OpenAI的API密钥,创建ChatOpenAI实例,构造用户消息并调用模型,最终打印模型响应。

  • Google Colab提供方便的Jupyter笔记本和云端计算资源,LangChain与OpenAI的结合简化了AI开发流程。教程详细介绍了配置准备、获取API密钥、创建ChatOpenAI实例、调用模型等步骤,使开发者能够轻松利用LangChain和OpenAI进行快速开发。

  • 教程以实际代码示范,使得即便是初学者也能快速上手。通过讲解每个步骤的目的和实现,读者能够深入理解LangChain和OpenAI在AI开发中的应用,为提高开发效率提供了有力工具和方法。

原文链接:https://juejin.cn/post/7314881190434635788

医渡科技发布医疗大模型,在多个任务场景中超越GPT 🏥

要点解析:

  • 2023年12月21日,医渡科技举办的“2023医疗智能大会”宣布医疗垂域大模型正式发布,标志着国内首个专业大语言模型面向医疗领域全面升级。医渡科技与华为签署深化合作协议,共同推动医疗大模型创新与应用,加速医疗健康产业的智能化转型升级。

  • 医渡科技大模型定位为“医疗超级大脑”,为医疗健康产业提供易使用、高质量、可定制的支持。面向B端可助力“医;教;研;管”提质增效,面向C端提供医学级别的个性化服务。合作伙伴包括昇腾AI,大模型已在全国排名前20的医院落地应用,应用场景涵盖多个医疗明确任务场景。

  • 医渡科技与华为联手发布智慧医疗解决方案,结合医渡科技大模型与华为在算力、软硬件、渠道等核心领域的优势,致力于全方位的战略生态合作,共同推动医疗大模型的创新与应用,加速医疗健康产业的智能化转型升级。

原文链接:https://www.jiqizhixin.com/articles/2023-12-21-12

技术教程

如何制作带有人物的NSFW AI?🔞

要点解析:

  • Character AI严格禁止生成和讨论不适宜内容,实施了强有力的NSFW过滤器,旨在维护安全和包容的用户环境。该过滤器能够自动检测并阻止包含明确性别语言或图像的对话。公司致力于创建积极用户体验,防止平台被滥用用于不适宜内容的创作。

  • 用户必须尊重和遵守Character AI制定的准则。这不仅是为了确保用户的舒适环境,也是为了遵守法律和道德标准。在Character AI上创作或尝试访问不适宜内容不仅会危及账户,还会破坏共同努力维护积极和尊重的社区。

  • 对于寻找 embr>Character AI严格禁止生成和讨论不适宜内容,实施了强有力的NSFW过滤器,旨在维护安全和包容的用户环境。该过滤器能够自动检测并阻止包含明确性别语言或图像的对话。公司致力于创建积极用户体验,防止平台被滥用用于不适宜内容的创作。

  • 用户必须尊重和遵守Character AI制定的准则。这不仅是为了确保用户的舒适环境,也是为了遵守法律和道德标准。在Character AI上创作或尝试访问不适宜内容不仅会危及账户,还会破坏共同努力维护积极和尊重的社区。

  • 对于寻找 embr>Character AI严格禁止生成和讨论不适宜内容,实施了强有力的NSFW过滤器,旨在维护安全和包容的用户环境。该过滤器能够自动检测并阻止包含明确性别语言或图像的对话。公司致力于创建积极用户体验,防止平台被滥用用于不适宜内容的创作。

  • 用户必须尊重和遵守Character AI制定的准则。这不仅是为了确保用户的舒适环境,也是为了遵守法律和道德标准。在Character AI上创作或尝试访问不适宜内容不仅会危及账户,还会破坏共同努力维护积极和尊重的社区。

  • 对于寻找embr>Character AI严格禁止生成和讨论不适宜内容,实施了强有力的NSFW过滤器,旨在维护安全和包容的用户环境。该过滤器能够自动检测并阻止包含明确性别语言或图像的对话。公司致力于创建积极用户体验,防止平台被滥用用于不适宜内容的创作。

  • 用户必须尊重和遵守Character AI制定的准则。这不仅是为了确保用户的舒适环境,也是为了遵守法律和道德标准。在Character AI上创作或尝试访问不适宜内容不仅会危及账户,还会破坏共同努力维护积极和尊重的社区。

  • 对于寻找embr>

原文链接:https://openaimaster.com/?p=29294

AIGC:优化openAI的LangChain使用指南 🚀

要点解析:

  • 使用LangChain和OpenAI优化openAI,提高开发速度。通过Google Colab简化环境配置,实现无忧运行Python代码和访问云端计算资源。在此基础上,介绍了如何获取OpenAI的API密钥,创建ChatOpenAI实例,构造用户消息并调用模型,最终打印模型响应。

  • Google Colab提供方便的Jupyter笔记本和云端计算资源,LangChain与OpenAI的结合简化了AI开发流程。教程详细介绍了配置准备、获取API密钥、创建ChatOpenAI实例、调用模型等步骤,使开发者能够轻松利用LangChain和OpenAI进行快速开发。

  • 教程以实际代码示范,使得即便是初学者也能快速上手。通过讲解每个步骤的目的和实现,读者能够深入理解LangChain和OpenAI在AI开发中的应用,为提高开发效率提供了有力工具和方法。

原文链接:https://juejin.cn/post/7314881190434635788

其他

ChatGPT 语音功能全新开放,免费用户也能畅享 🎉

要点解析:

  • OpenAI宣布ChatGPT语音功能全面开放,为所有免费用户提供自然对话体验,无需支付费用。用户可在应用中选择语音进行旅途中的闲聊、为家人朗读故事或解决晚餐辩论,体验仿若真人交流的奇妙互动。

  • 在Google Play商店更新中,用户可在“事件和订单”部分看到该更新信息,提示下载ChatGPT应用并点击耳机图标即可开启语音对话之旅。尽管苹果App Store尚未发布相关公告,但该功能已悄然上线。

  • 使用ChatGPT等AI聊天工具时,用户需谨慎对待输出信息,因为这些工具可能提供不准确的信息。语音功能的开放为用户提供了更广泛的应用场景,旨在提高交互体验。

原文链接:https://www.ithome.com/0/740/826.htm

为什么死亡计算器AI这么火?📈

要点解析:

  • 国际团队开发的AI计算器"life2vec"以独特方式预测寿命,采用变压器神经网络分析生活事件序列而非传统的健康和人口数据。凭借78%的准确度,超越行业标准,该模型提供了预测寿命的重大改进。不仅涉及死亡预测,还可揭示个性特征、兴趣和重大人生决策的可能性。

  • 尽管78%准确度较高,研究人员强烈警告不要将"life2vec"预测用于个体高风险决策。然而,该技术在制定政策、规划基础设施和经济预测方面具有潜在用途,为全球卫生和保险行业提供更准确的人均预期寿命范围。

  • 随着算法能力的增强,"life2vec"等AI在生物学奥秘方面的探索将催生新的科技可能性。然而,必须谨慎引导其发展,以防止滥用,并确保透明、公正、可控的使用这些预测工具。

原文链接:https://openaimaster.com/?p=29303

Humane的AI Pin能经受时间考验吗?⌛

要点解析:

  • AI Pin, priced at $699, is a screenless wearable designed by ex-Apple employees, Imran Chaudhri and Bethany Bongiorno, to combat smartphone addiction. The device integrates AI seamlessly into daily life, offering functionalities without a traditional interface.

  • Operating on the cosmOS, the AI Pin utilizes GPT-4 for natural language processing. It features a Qualcomm Snapdragon chipset, an AI-powered cloud inventory called 'AI Bus,' and various sensors. The device performs tasks like scheduling, health monitoring, language translation, and more through voice, gesture, or touch commands.

  • Despite innovative features, critiques arise, questioning the device's ability to replace smartphones entirely, citing concerns about battery life, AI accuracy, and the $699 price tag.

原文链接:https://hackernoon.com/can-humanes-ai-pin-survive-the-test-of-time?source=rss

免费畅享最佳AI音乐生成器 🎵

要点解析:

  • 人工智能(AI)让音乐创作变得前所未有的简单和便捷。AI音乐生成器使任何人都能制作无版权的歌曲,即使没有音乐背景也能轻松完成。这些工具根据用户设置的提示和参数,在几秒钟内就能创作并生成完整的音轨。

  • 2023年,AI将继续改变音乐制作的方式。今年已经推出了一些开创性的音乐生成AI模型,如谷歌的MusicLM和Anthropic的Claude。随着技术的进步,AI音乐的声音越来越接近人类制作。

  • 如果你想尝试AI音乐制作,以下是今天可用的顶级免费生成器:

    • VEED – 最适合快速创作: VEED是一款多功能的在线音视频编辑工具包。他们的AI音乐生成器是最快速、最容易使用的,用于快速创作音轨。选择一个音乐“氛围”,如流行、嘻哈、舞曲和摇滚,然后写下一个简短的文本提示,详细描述你想要VEED创作的音乐类型。提交提示后,VEED立即生成一分钟长的音轨,符合你的描述。你可以重新生成新版本,直到得到满意的结果。然后下载最终的MP3文件以免费使用。

    • BeatBot – 最佳AI歌词: 由Anthropic创建,BeatBot利用先进的AI生成音乐和歌词。它特别擅长根据你提供的提示写出智能而富有意义的歌词。描述你想要讲述的整体歌曲主题或故事,然后提供有关流派、乐器、情绪等的详细信息。BeatBot随即即时创作一段根据你的提示制作的短音轨,结果涵盖流行、说唱、民谣和乡村等各种风格。你可以不断重新生成音轨,直到得到引人入胜的作品。然后导出最终音频或仅歌词转录。

    • SOUNDRAW – 最先进的功能: SOUNDRAW利用高度先进的AI系统生成工作室质量的音乐。基本版本免费,订阅可以解锁更多功能。免费模式允许你创建无限数量的一分钟歌曲。描述流派、情绪、乐器等,SOUNDRAW会立即渲染与你的提示匹配的音轨。尽管是计算机生成的,但结果听起来非常真实。付费订阅解锁更多功能,如更长的3-5分钟歌曲、音轨导出、自定义歌词和商业使用权。无论使用免费还是付费版本,SOUNDRAW生成的音乐都令人印象深刻,非常接近人类制作。这是创意专业人士的首选。

原文链接:https://openaimaster.com/?p=29320

OpenAI发布ChatGPT新功能,用户可选择归档聊天记录 📜

要点解析:

  • ChatGPT的母公司OpenAI最近推出了聊天档案功能,用户可以将不想删除但不经常查看的聊天存档。这项功能已在网页版和iOS版上线,Android版本即将推出。

  • 为了存档与ChatGPT的聊天,用户只需进入搜索聊天窗口,点击三个点,然后选择存档。这一功能解决了用户如何在不永久删除的情况下整理聊天侧边栏中可能积累的杂乱问题。

  • 除了聊天档案功能,OpenAI还最近将ChatGPT的语音聊天功能免费开放给所有用户。此前,仅付费用户才能使用语音聊天。该功能仅在ChatGPT移动应用上可用,网页版尚未支持语音聊天选项。

原文链接:https://www.businesstoday.in/technology/story/openai-announces-new-feature-for-chatgpt-users-get-the-option-to-archive-their-chats-410407-2023-12-21?utm_source=rssfeed