中国智能媒体创新发展报告2022-2023.docx

上传人:夺命阿水 文档编号:1077014 上传时间:2024-03-13 格式:DOCX 页数:63 大小:606.94KB
返回 下载 相关 举报
中国智能媒体创新发展报告2022-2023.docx_第1页
第1页 / 共63页
中国智能媒体创新发展报告2022-2023.docx_第2页
第2页 / 共63页
中国智能媒体创新发展报告2022-2023.docx_第3页
第3页 / 共63页
中国智能媒体创新发展报告2022-2023.docx_第4页
第4页 / 共63页
中国智能媒体创新发展报告2022-2023.docx_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《中国智能媒体创新发展报告2022-2023.docx》由会员分享,可在线阅读,更多相关《中国智能媒体创新发展报告2022-2023.docx(63页珍藏版)》请在课桌文档上搜索。

1、报告目录01大模型带来媒体融合新机遇02;中国智能媒体年度理论探讨(03中国智能媒体创新应用亮点04中国智能媒体发展趋势研判大模型带来媒体融合新机遇ZReportontheDevelopmentofIntelligentMediaConvergenceinChina(2022-2023)-技术环境:能力升级,迭代更新美国中国伴随计算机技术与人工智能技术的研发突破,新一轮的发展热点也逐步显现,CHATGPT的爆火带来的是整体大模型行业的齐头并进,从自然语言模型到深度机器学习,大模型技术推动着新一轮的Al技术的发展。通用AI能力的广泛应用也使得大模型技术日趋成熟,同时掌握尖端大模型技术的水平高低也

2、成为了国力竞争的衡量参考之一。xmg4G(IHr.EN)Ml:V5HG8M:300500G53(OeM.CN)M170MrSTOGB:100oo11oogmTenStfn(OpenAl.CN)0:67。BM:UWXMICn(MLEM),。:16万。mrTSOGB:J11FU9M.EN)Msxnzm一PM(Mt.CN)M540Oe3一*a:4096TPUr3各(RnNU&W”&tt:woOeMl-58文本(D窗,IMsttl图:部分国内外大模型参数量对比公司NLPCV多模态*zoNi:1力万CM49TBB.XaM:模型学数量模型泰数量模型参数量国产模型百度ERNIE3.0-Titan260BVI

3、MER-UFo2.017BERNIE-ViLG2.024B文。WM30(SflnNUWOCBB4TXM:Jmv100gpu讯HunYuan-NLP1THunYuan-VCfHUnYuanjvr阿里AIiceMind-PIug27B通义-视觉M610T华为代古语义大模型200B食古视更大楼型3B盘古多模方大模型-”WO亿SK19TBXcn(*XM1M5)Me014ZMLXB6海外模型OpenAIGPT-3175BImageGPT6.8BDALLE23.5B谷歌PaLM540BV-MoE15BPaLI17BViT-22B22B微软TuringULRv65.4BSwinTransfonerV23BB

4、E-31.9B图:多模态分类标签框架AogregatnnLayvrbonUryw图:多模态语义标签框架一、技术环境:能力升级,迭代更新多模态内容语义理解技术基于多模态内容语义理解技术模型构建一种基于多模态信息融合的语义理解模型,为多模态数据生成多知识维度的语义标签。该系统包括两个子模型:多模态分类标签模型(VeT)和多模态语义标签模型(VST),分别为视频生成分类标签和语义标签。多模态分类标签是预测t。PiC的类别,由于一级、二级类别合并后并不多,因此采用组合的方式进行文本分类。整体模型思路为一个两阶段框架,如下图所示,第一阶段是多模态特征编码,第二阶段包括多模态特征融合和分类器。图:预训练示

5、意图(a)ObjectDetection(b)VisualGrounding-技术环境:能力升级,迭代更新预训练大模型预训练大模型是目前深度学习领域的一个重要趋势,它通常涉及使用大量数据对大型神经网络进行预训练,以学习一种普遍适用的知识表示.此类模型一股分为两个阶段进行训练:预训练阶段和微调阶段.项训练阶段:在这个阶段,模型会在大量无标签数据上进行训练,例如整个互联网上的文本。这个过程被称为无监督学习,因为模型只需预测输入数据的某些方面,而不需要任何人工标签.在这个过程中,模型会学习到丰富的数据表示,例如单词、短语、句子的含义和它们如何组合在一起.微调阶段:在这个阶段,预训练过的模型会在特定任

6、务的有标签数据上进行进一步训练。例如,如果我们要训练一个新闻分类器,我们就可以在具有新闻类别标签的新闻文章数据上进行微调.在微调过程中,模型会学习到如何将在预训练阶段学到的知识应用到特定任务上.二.产业环境:大厂入局,构建生态国内各大科技企业纷纷入局Al大模型图:部分大模型厂商发展情况一览公司大模型模型底座NLP大模型CV大模型多模态大模型忖色Bai&SS文心大模型飞桨 PaddIePaddIe 深度学习平台文心NLP大模型 (ERNIE3.0)文心CV大模型(VlMER系列)文心跨模态大 模型(ERNlE 变体)构建了文心 大模型层、 工具平台层、产品与社区 三层体系Tencent Nffl

7、混元大模型太极机器学习 平台HunYuan-NLPHunYuan-VcrHunYuan tvr、 太极文工图广告类应用 表现出色CAIMmUhi Koop ee 通义大模型M6-OFA通义一 AIiceMind通义视觉通义M6构建了Al统 一底座典HUAWEI盘古大模型ModeIArts盘古NLP大模型盘古CV大模型也未上线发挥MOde as-a-service 商业价值大模型增强了AI技术的通用性,助力普惠Al的实现。未来,大模型有望于场景深度融合,配合专业工具和平台支持应用落地,开放的生态来激发创新,形成良性循环。头部企业均采取模型+工具平台+生态三层共建模式,有助于业务的良性循环,也更容

8、易借助长期积累形成竞争壁垒。大模型厂商主要包括百度、腾讯、阿里、商汤、华为等企业,也有智源研究院、中科院自动化所等研究机构,同时英伟达等芯片厂商也纷纷入局。二、产业环境:大厂入局,构建生态图:百度文心大模型全景文心百中百度文心大模型百度文心构建了文心大模型层、工具平台层、产品与社区三层体系。 产品能力:文心大模型+飞桨PaddiePaddle深度学习平台,满足市场大规模落地需求。 应用能力:百度已在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例。 生态能力:在社区用户的基础上,可以实现与开发者、行业用户、上下游产业的正向互动。EasyDL三三8ML大拿切AJ开MFM工与零力X

9、-6三WiSR三-三tXOWJ-SXONLP大模牛代码Se*tch语言理解与生成ERHEWTkvERMElOXSSgMUbft(Pb行业大模型航天s三文心EKMElOZeui人员网百文心电影密百安文心-sat-xoTeI日度文心CV大模型跨模会大根型牛物H*大极中OCRB9於季习任务学习vMUt-cm白疡也觉机竽习VIMS6化台SHi学习HefaGtM0B-三*-M图:腾讯HUnYUan大模型全景评测收据和标准共建多海训练数爆脱敏/清洗/平台化二、产业环境:大厂入局,构建生态腾讯混元大模型2022年4月,腾讯首次对外披露HUnYUan大模型信息、,该模型协同了腾讯预训练研发力量,完整覆盖NLP

10、大模型、CV大模型、多模态大模型及众多行业/领域任务模型。 HunYuan-NLP:万亿级别中文NLP预训练模型,参数量达IT,排名CLUELi总排行榜第一 HunYuan-Vcr:排名VCR(ViSUalCommonsenseReaSC)ning)榜单第一 HunYuanJvr:跨模态文字-视频检索Al大模型图:阿里通义大模型架构二.产业环境:大厂入局,构建生态阿里通义大模型2022年9月,在阿里巴巴达摩院主办的世界人工智能大会大规模预训练模型”主题论坛上,发布通义大模型系列,并宣布相关核心模型向全球开发者开源开放。 阿里达摩院基于其Al统一底座构建了通用模型与专业模型协同的层次化人工智能体

11、系。 统一底座层:M6-OFA模型作为单一模型,在不引入新增结构的情况下可处理超过30种跨模态任务。 通用模型层:NLP模型通义-AIiCeMind;CV模型通义-视觉;多模态模型通义-M6. 专业模型层:深入电商、医疗、娱乐、设计、金融、工业、制IMk等行业。台作伙伴交付BTAXJB行业大模加*tt 大*立XaAMmRMm椅WLSXfTft (候速交付:XfM. 0学2,小2注)K杼金大IMl (Wftknow how:狞业IMMM. HfMtt)10,11 行重 企也传ItIVitffI M TMUM工作源订A于 TJKHHMI美 SlMy 电博分听 9怯M 糊k(R*F gmran tt

12、smIraIlAWorkflow2.0PRO工作澹并行推理推架修处理法ModelArts Studio图:盘古大模型架构图:盘古NLP大模型参数量二.产业环境:大厂入局,构建生态华为盘古大模型华为云团队于2020年立项Al大模型,并于2021年4月发布盘古大模型。受益于华为的全栈式AI解决方案,大模型与昇腾(ASCend)芯片、昇思(MindSPOre)语言、ModeIArts平台深度结合。盘古大模型已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。2022年11月,华为云进一辘代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型

13、、盘古矿山大模型、盘古OCR大模型三项重磅服务。中共中央政治局召开会议分析研究 当前经济形势和经济工作,指出要 重视通用人工智能发展,营造创新 生态,重视防范风险。中共中央政治局于2023年4月28日召开会议 中共中央总书记习近平主持会议三、政策环境:政策利好,行业规范“推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。“加强全媒体传播体系建设,塑造主流舆论新格局。健全网络综合治理体系,推动形成良好网络生态。高举中国特色社会主义伟大旗帜为全面建设社会主义现代化国家而团结奋斗在中国共产党第二十次全国代表大会上的报告三、政

14、策环境:政策利好,行业规范关于加快场景创新以人工智能高水平应用促迸经济高质量发展的指导意见IIIIH意见提出着力打造人工智能重大场景。提升人工智能场景创新能力。加快推动人工智能场景开放。鼓励常态化发布人工智能场景清单,支持举办高水平人工智能场景活动,拓展人工智能场景创新合作对接渠道.加强人工智能场景创新要素供给。推动场景算力设施开放,集聚人工智能场景数据资源,多渠道开展场景创新人才培养,加强场景创新市场资源供给。2022年7月科技部、教育部、工和信息化部、交通运输部、农业农村部、国家卫生健康委关于支持建设新一代人工智能示范应用场景的通知-Illlll通知提出加快推动人工智能应用,助力稳经济,培

15、育新的经济增长点,坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,充分发挥人工智能赋能经济社会发展的作用,围绕构建全链条、全过程的人工智能行业应用生态,支持一批基础较好的人工智能应用场景,加强研发上下游配合与新技术集成,打造形成一批可复制、可推广的标杆型示范应用场景。首批支持建设十个示范应用场景。2022年8月科技部关于规范和加强人工智能司法应用的意见IIIIIF-意见提出到2025年,基本建成较为完备的司法人工智能技术应用体系,为司法为民、公正司法提供全方位智能辅助支持。至!12030年,建成具有规则引领和应用示范效应的司法人工智能技术应用和理论体系,为司法为民、公

16、正司法提供全流程高水平智能辅助支持,应用效能充分彰显。2022年12月最高人民法院三、政策环境:政策利好,行业规范北京市互联网3.0创新发展白皮书(2023年)-min白皮书认为互联网3.0是现代科学技术的集大成者,是未来互联网产业发展的新形态,高度的智能化、虚实融合发展和完整的经济形态是其主要特征。白皮书认为,当前生成式人工智能、XR交互终端、内容制作工具平台等是互联网3.0产业的研究热点,百度、字节跳动、腾讯、苹果、Meta,微软、谷歌、英伟达等国内外科技巨头纷纷开展布局,并引领产业发展;数字人、数字藏品等新兴应用快速发展落地,创新主体纷纷开展应用落地探索02023年5月北京市科学技术委员

17、会、中关村科技园区管理委员会上海市促进人工智能产业发展条例-IIIRII条例提出促进人工智能产业高质量发展,强化新一代人工智能科技创新策源功能,推动人工智能与经济、生活、城市治理等领域深度融合,打造人工智能世界级产业集群。本市人工智能产业发展应当坚持以人为本、科技向善、创新驱动、市场主导的原则,建设开放生态融通、创新集群活跃、超级场景泛在、敏捷治理安全的人工智能产业体系,建成具有国际影响力的人工智能上海高地2022年10月上海市人民代表大会常务委员会深圳市加快推动人工智能高质量发展高水平应用行动方案(20232024年)-min行动方案发布首批“城市+AI应用场景清单,并统筹设立规模100O亿

18、元的人工智能基金群,积极打造国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,创建人工智能先锋城市。行动方案从强化智能算力集群供给、增强关键核心技术与产品创新能力、提升产业集聚水平、打造全域全时场景应用、强化数据和人才要素供给、保障措施等6个方面,提出18项具体举措。2023年6月中共深圳市委办公厅、深圳市人民政府办公厅中国智能媒体年度理论探讨/I.ReportontheDevelopmentofIntelligentMediaConvergenceinChina(2022-2023)-原子力理论讨论智能媒体研究,智能原子力是一个非常 重要的思想。在对多家互联网企业调研的过程 中,

19、人工智能平台强调的人工智能技术能力,都 强调了 “智能原子力”这个概念。什么叫原子力 呢?原子的力量有两个,一个是聚变,一个 是“裂变,聚变和裂变都会推动整个生态的蓬 勃发展。人工智能平台提供的是具有标准化、复 用性、可扩展、可授权、可定价等特点的人工智 能工具。原子能力代表各维度能力之间深度的交 流和联合,能力相互关联从而迸发如原子聚变般 的效果,促进媒体智能化发展。智能媒体依托于 各项原子能力集成于智能媒体平台,以云化、数 字化为基础,以智能化为核心。,人脸识别技术:人脸识别技术是智能媒体原子力之一,是市场应用较广泛的人工智能技术。J智能人体识别:人体行为识别的关键是提取行为特征,视频中人

20、的行为特征需要描述人在图像空间中的外观,提取外观和姿势的变化,即从二维空间特征扩展到三维时空特征。/OCR(光学字符)文字识别技术:OCR文字识别技术的原子力是做减法,把复杂的多模态变为成熟简单的智能文字处理。,智能视频技术:智能视频技术近年得到了高度重视,这和互联网短视频的快速发展分不开。/智能语言技术:智能语言技术在媒体中的应用比较早,典型的应用是“关键词。/智能语音技术:主要由语音识别技术(ASR)和语音合成技术(KS)两大技术板块组成。/智能图像技术:智能图像技术包括:图像采集,图像分割,图像比对,图像预处理,目标识别和分类,目标检测和跟踪,目标定位和测量。二、平台力理论平台力(Pla

21、tform Power)理论是指平台型业 务在市场和社会中所形成的特殊力量。这种力 量源于平台的网络效应,即平台的价值随着使 用者数量的增加而增加,同时平台的多边性质 (连接多个用户群体)也会放大这种效应。平 台力量的存在使得平台型企业能够控制关键的 资源和信息,从而在市场中形成垄断地位。平台力理论为我们提供了一个有力的分析工 具,以帮助我们理解并应对这些挑战,推动智 能媒体健康、公平、公正的发展。在智能媒体领域,平台力的表现主要体现在以下几个方面:,内容的集中:通过智能算法,平台可以高效地筛选、整合、分发各种形式的媒体内容,使用户可以方便地获取和消费信息。/数据的累积:平台可以通过S艮踪用户

22、行为,收集和分析大量的用户数据,从而形成丰富的用户画像,并通过这些画像优化内容推荐,提高用户粘性。,个性化推荐:通过深度学习等AI技术,平台可以根据用户的兴趣和行为进行个性化推荐,进一步加强用户对平台的依赖。然而,平台力在带来便利的同时,也存在一些问题,如信息过滤气泡(信息的同质化)、数据隐私问题、算法公平性问题等。对于平台力的管理和规范,需要政策制定者、企业和公众的共同参与和努力。China(2022-2023)/生产流程的协同:伴随Al介入新闻业,新闻生产的环节和流程实现了融合与协同。新闻生产主要包括信息采集、内容生产和新闻分发三个主要的环节,而人工智能技术的深度参与将打破三个环节之间的壁

23、垒。人工智能技术可以将信息采集和内容生产集中在自动内容生成模型中进行,即新闻工作者不需要介入,便可直接从人工智能模型之中获取一篇经过信息收集和内容编排的完整稿件。,生产主体的协同:在生产主体层面,人工智能技术的渗透使得不同分工的新闻工作者打破各自的职业边界、开始走向协同,塑造了真正的全媒体新闻工作者。在Al赋能新闻生产之前,新闻编辑、文字记者、摄影记者、剪辑师等不同工种新闻工作者的分工十分明确。/生产关系的协同:AI赋能新闻生产最根本的就是实现人与机器的生产关系协同。伴随着人工智能技术的发展,其功能越来越强大,能够发挥作用的领域也愈加广泛。因此,原来人与机器的控制与被控制关系逐渐演变为更为平等

24、的协作关系。三人机协同理论“人机协同理论也称为人机协作或人机配合理论,是研究人类与机器如何协同工作以实现优于单一人类或机器工作效果的领域。其基本观念在于通过智能技术辅助,人类可以更有效地执行任务,而人类的专长和决策能力也可对机器产生补充,使整体执行效率和效果得到提升。虽然学界和业界的争论还在继续,但AI赋能新闻生产已成为不可逆转的潮流,即便“暂停也无法阻挡其星火燎原之势。与其担忧其所带来的新闻和社会危机,不如思考如何使人工智能更好地服务于新闻生产,并且尽可能规避其局限和不良影响。人工智能的深度介入,推动媒介融合向人机协同进阶,实现了人与机器、媒介与技术在形态、机制、文化和内在逻辑层面的深度融合

25、。四、内容元价值理论元价值是价值形成的始源性价值,是价值的始源性关系 评判和目的意向。创造力是指创造或发明新的想法、 概念、理论、艺术作品或产品的能力,涉及思维、想 象、判断、灵感、创新等方面。人类被广泛认为是具 有创造力的,因为人类能够萌生提出新想法、新内容 的冲动。新想法的提出与创造,造就了内容的产生与 发展,基于此,创造力才是内容的元价值。拥有独特创造力的作品可让人记忆深刻,产生共鸣, 从而吸引更多的关注和参与,推动内容的传播和发 展。内容的创造力是推动社会、文化和科技进步的重 要因素。当内容具有创造力时,它能够影响和改变观 众的思考方式和行为方式,产生深远的影响。创造力 也是内容创作者

26、的核心竞争力,是内容产业的核心驱 动力。JAI创造力错觉:模仿式创新。AIGC是基于模仿、模型和概念的内容创作。基于模仿的创作即通过大规模的数据集和先进的深度学习算法进行训练,生成与之类似内容。当前AlGC使用预训练模型生成的内容,彰显创造性和高效性。基于特定的概念来生成内容,则是通过提供有关特定主题或概念的信息,使AIGC生成与该主题或概念相关的内容。,模仿式创新与人类创造性存在本质差异。AIGe的内容创造力本质仍是模仿式创新,是对人类的思维过程和创造力的学习和模拟。这种模仿式创新的能力使AIGC能够在各种领域创造出新的想法和作品,但与人类的创造力本质不同。,创造力鸿沟:想象力情感非结构化思

27、维。人类的创造力具备独创性、创新性、多样性、风险承担、自我表达、有意义等特征。从根本上说,人类的创作方式则更依赖于想象力和灵感,可以从不同的角度思考和创作,能够跨越不同的领域和概念,产生多样、独特的作品,这是Al的模仿式创新无法达到的,以至两者的创造方式和生成内容的质量上还有一定的差距。受限于数据和模型的质量,AIGC有时难以突破已有的模式和框架,尽管AlGC在内容生成方面已经取得了很大的进展,但在“创造力”层面仍存在挑战和欠缺,无法代替人类创造力的价值和意义。中国智能媒体创新应用亮点.ReportontheDevelopmentofIntelligentMediaConvergenceinC

28、hina(2022-2023)图:自然语言大模型发展历程o1.argeLanguageModels第三部分中国智能媒体创新应用亮点ReportontheDevelopmentOfInteIIigentMediaConvergenceinChina(1.m然语言大模型带动文字媒体回归自然语言大模型是指能够处理和理解自然语言的大型人工智能模型,如OPenAl开发的GPT-3。这些模型具备大规模预训练、上下文理解、多语言支持、零样本学习、通用性等技术优势。近年以来,所有自然语言处理的任务都有了长足进步,效果飙升,许多任务都超越了人类专家的水平。其行业应用也愈加广泛,金融、医疗、司法、制造、营销、媒体

29、等各行各业都是使用自然语言处理技术提升效率,降低风险。对于媒体行业而言,自然语言大模型的应用不仅将提升内容生产力,改善内容生产质量,更加有望重塑文字媒体的产消流程与价值链条,助力文字媒体的回归。1.m然语言大模型带动文字媒体回归自然语言大模型发展对纯文字类媒体产生了显著的影响,并有潜力扭转之前文字媒体相对视频媒体的传播劣势,促进文字媒体的回归。其关键影响主要体现在以下方面。与此同时,可信度和质量控制、多样化的内容需求、多模态媒体的吸引力也是其需要积极应对的挑战。纯文字类媒体仍需不断创新和改进,以适应用户需求并保持在不断发展的媒体行业中的地位。自动化报道IIH自然语言大模型可以 用于自动化新闻报

30、道 和事件分析。通过将 大量数据和信息转化 为易于理解的文本, 纯文字类媒体可以更 快速地发布新闻,并内容自动生成Hl自然语言大模型具有强大的文本生成能力,可以自动创建高质量的文章、新闻报道、博客和其他文本内容.这意味着纯文字类媒体可以利用这些模型去生成更多、更丰富、更个性化的内容,从而吸引更多的读者。提高内容质量IM自然语言大模型可以用于编辑和校对,帮助纠正错误、提高文章质量,从而提升读者的阅读体验.这将使纯文字类媒体能够提供更可靠、更准确的信息,增强读者对其内容的信任。个性化内容推荐 大模型可以根据用户的历史浏览和兴趣,为读者推荐个性化的文章和内容。这有助于提高用户粘性,使纯文字类媒体能够

31、更好地竞争并吸引用户。解决多语言问题 Ml自然语言为莫蛔常支持多种语言,这使得纯文字类媒体能够更好地跨越语言和文化边界,覆盖全球受众.增强互动体验IIH大模型可以用于创建更智能的聊天机器人和问答系统,提供更好的读者互动体验。这将有助于纯文字类媒体更好地与读者互动,增加用户参与度。图:多模态大模型应用场景Ii合内容视频分类逶看.文本件格制*.视期.文本联合察构KW吩析*,接理.文本视觉问答图像.文本Ilm分析a.慢频.文本ABiRMA*.视频跨懵态Mm像.文本册同架构8B像标注期像、文本M模态嵌入朋像.规男.文本的格学习像.文本像柞注文本器架构视颊解码模频、文本11合成.文本第三部分中国智能媒体

32、创新应用亮点ReportontheDevelopmentOfInteIIigentMediaConvergenceinChina(22.多模态大模型驱动全媒体创新发展Whisper 语音文本多模态大模型是一种综合利用多种输入模态数据的人工智能模型。它通过融合图像、文本、音频、视频等不同类型的数据,实现更全面、更丰富的信息理解和处理。其具备融合多模态数据、跨模态表示学习、上下文理解、多模态生成等技术特点。多模态大模型目前在学术界和工业界都引起了广泛关注。例如,OpenAI、GooglexFaCebOOk等研究机文嬴构和公司都在开展多模态大模型的研究和开发。其中,OPenAl的CLlP模型和GoO

33、gle的VLP模型等都取得了显著的成果。此外,多模态大模型在视觉和语言mu领域的应用逐渐增多,涵盖了视觉问答、图像描述生文本掘频成、多模态翻译等多个领域。2.多模态大模型驱动全媒体创新发展多模态大模型的快速发展为全媒体带来了许多机会,包括丰富的内容呈现、个性化推荐、语义理解和推理等。然而,全媒体也需要应对数据处理和存储的挑战,保护数据隐私和安全,提高模型解释性,同时投入足够的资源和人才来支持技术的研发和应用。丰富内容呈现Uii多模态大模型可以综合利用图像、文本、音频、视频等多种媒体类型,为全媒体提供更丰富多样的内容呈现方式.通过结合不同模态的信息,全媒体可以提供更有趣、更具吸引力的内容,吸引更

34、多的受众.精准个性化推荐多模态大模型可以对用户行为和兴趣进行更全面的分析,从而实现更准确的个性化内容推荐.全媒体可以根据用户的喜好和需求,为每个用户量身定制内容,提高用户满意度和忠诚度。全媒体场景拓展-Illlll多模态大模型可实现跨模态任务,其应用场景丰富,可移吗区动全媒体创新,推动媒体与其它场景的深度结合,提5三体在家居、驾驶等新场景中的融合渗透,提升智能人机交互体验。提升用户体验min多模态大模型可以综合不同模态的数据进行语义理解和推理,提高对用户意图的理解和回应能力。这使得全媒体能够更好地与用户进行交互,提供更智能化的服务。跨平台扩展多模态大模型可以处理不同类型的媒体数据,这使得全媒体

35、可以轻松跨越不同的平台,如网站、移动应用、社交媒体等,覆盖更广泛的受众群体3.AlGC工具行业应用垂直化发展提速文学娱态生成长文本提取摘要关键词生成诗歌、故事等文本语义转化文字表达优化躇蟆态生成-MIM多模态创意内容生成文字-图臃互雌文字-视频相互转化音频、图像等联合处理图片膜态生成ININ创意图像生成图像类型转化照片转特定风格绘画AlGC是人工智能生成内容,指通过机器学习、自然语言处理和其他人工智能技术生成文本、图像、视频等内容。随着三大核心技术突破,2022年AlGC应用迎来集中爆发。回顾历史,内容生产范式经历了由PGC、UGC到AlGC的巨大演变,通过不断提高生产效率、扩大生产规模,生产

36、关系由少数人掌握制作工具和渠道转变为更多的人获取低成本的工具、平台,促进了内容的广泛传播和共享。同时,内容消费者也从“被动接收变成了主动参与和创造,实现了生产和消费的双重革命。而目前AIGC效率工具的快速渗透也加剧了行业应用垂直化发展的趋势。音频膜态生成Yiim智能语音修改音频剪辑、拼接、混响等多元音效、风格音艇成基相乐视凝蟆态生成Ilw智能剪辑:片段选择、排序和理等智:崛掇等智能视频生成与风格转化3.AlGC工具行业应用垂直化发展提速当AlGC与不同行业进行垂直化结合时,可以针对特定行业的需求和特点开发定制化的应用,生成符合特定行业背景和特点的内容。通过定制化的AIGC工具,可以提高效率、个

37、性化服务、加强信息分发和优化决策,在不同行业中带来更多的机遇和创新。AIGC+新闻媒体生成新闻报道、摘要和评论,快速发布新闻内容,根据不同受众需求生成个性化新闻推荐.自动生成视频剪辑和音频,用于新闻报道、纪录片制作等。自动分析社交媒体和新闻平台上的言论和情绪,了解舆1嗣欣AIGC+营销*BM 生成广告标语、宣传文案和产品描述 基于用户数据和行为分析生成个性化广告内容,提高投放效果和转馋 自动发布社交媒体内容,增强品牌曝光和社交媒体营销效果。AIGC+电商零售-linn 自动生成商品描述和评论,提高商品搜索和推荐准确性。 生成个性化的购物推荐和建议,提高用户购物体验和增加销售额。 开展营销邮件和

38、客户服务,提高客户满意度和效率。AIGC+医疗健康-linn 生成医学文葡摘要和总结,快速获取重要信息。 根据用户提供的症状和健康数据,生成个性化的健康咨询和建议。 结合医学数据库和病例资料,生成辅助医生进行疾毓酬相等腱议。AIGC+金融投资-Hll,生成金融市场动态的新闻报道,帮助投资者了解市场趋势和分析。生成个性化的投资建议和组合配置。分析金融市场的风险和波动性,生成风险评估报告和策略建议。4.智能云平台促进智媒体高质量发展当前技术背景下,政策驱动传统媒体向融合、智慧、移动、高清化转型。传统媒体需要紧跟时代潮流,利用技术支持,搭建“云智一体”的全新智媒云平台,加速自身向自主可控、互动、智能

39、型媒体发展。智能云是一种全流程、全场景的智能媒体解决方案,可为媒体行业智能化转型注入生命力,助力媒体产业全面升级。通过跟央媒、省市广电等媒体机构以及头部学校合作,探索产学研结合,提升媒体影响力,打造新型主流媒体、融媒体的大发展格局,实现媒体产业的可持续发展。智能云平台应用与发展特点:智能云平台可为媒体机构提供包括基础设施建设、能力中台、业务前台、用户端服务在内的完整能力支持,实现从内容生产到消费的全闭环技术体系。推动媒体与服务模式升级,为媒体创新与探索更多元化、交互性更强的商业机会提供技术支持,打造全新的产业生态圈。能力中台业务前台面向视频业务场景,提供Al技术的直播、点播、转码、技审服务能够

40、针对性地面向新闻线索收集、移动采编汇聚、内容资源管理等当前痛点,提供全媒体生产工具集5.智媒中台成为融媒体生产力加速器融媒体时代,传统媒体运作方式已经难以承担海量图、文、音视频素材的有效管理,以及对于采编存管播发全流程的时效性需求,传媒行业亟待新技术带来生产力的全面提升。智能媒体中台在智能编目、智能拆条等技术功能的基础上,进一步强化智能标签能力,让内容标签颗粒度更细、理解度更深、泛化性更高。同时全面升级智能检索能力,不仅支持多模态检索,还可以支持对于图片、视频、文稿等媒资素材的跨模态检索,可以帮助传媒客户有效提高内容搜索的准确性、内容生产的质量和速度、内容分发的实际效果,不断扩大行业想象空间,

41、成为更加智能化的融媒生产力加速器。RPI网关Hl一摧口愕用.If整折家图:腾讯云智能媒体AI中台12项智能应用RitttanBK99文本,文本,SMiS台栏目以81维寿tRI_主持人,别音需编量切分头切分。花9tt9faasae9可凌化控罚台司费化摩智能开发Rl工作室算法仓降视觉交互增强现实交互6 .智能人机交互提升用户智媒体体验人机交互是人工智能最具挑战性、最综合性的技术,涵盖了语义理解、知识表示、语言生成、逻辑与推理等各个方面。随着模型规模的不断扩大和性能的不断提升,大模型已经成为了推动人机交互革命的重要力量。大模型驱动的人机交互革命正在改变着我们的生活和工作方式,使得人类与计算机之间的交

42、互更加自然、智能和高效。随着大模型技术的不断发展和应用,我们可以期待基于各种智能媒体之上的更加智能化和普及化的人机交互体验,从而推动人类社会的数字化转型和进步。图:人工智能数字人三大应用方向IP影响力粉丝经济替代真人服务降本增效人性化陪伴和智能化服务替代连接7 .AI数字人或成智能媒体超级入口数字人的核心是人使虚拟形象带来真人般的感受和互动。一方面,随着人工智能等技术的发展和融合,数字人的拟人化程度愈来愈高。另一方面,人工智能技术在数字人形象生成、动作驱动和语言交互等环节的深入应用将提升数字人制作的自动化水平。一般将数字人分成L1-L5五个等级。在前三个阶段,数字人还处于“有颜无智的状态,L4

43、级别以上的数字人,实现了从“有颜无智向有颜有智”的跃使用 目的底层 逻辑升。这类数字人可以独立与人进行实时的智能化交互,生产效率也有了大幅的提升。只有此级别以上的数字人才能真正帮助产业解决经济发展中普遍会面临的“人效”问题,并基于生产效率跃升进而实现规模化落地和推广。8.内容风控筑起智媒体内容安全高墙随着大众内容消费和自我表达的需求不断升级,聚焦UGC建立的平台也在不断涌现,催生了人人都是创作者”的时代。大众参与的UGC在极大丰富互联网内容的同时也给平台带来巨大的审核挑战,包括来自监管要求的色情、涉政、违禁、暴恐等内容和损害平台自身利益的广告导流、黑产等。多种多样的用户内容尤其是非结构化数据的内容识别难度很高,这就需要Al智能审核的帮助。通过对海量数据深度学习,结合算法对特定场景建立相应的分析模型,进行文本、图片、视音频内容识别,结合产生内容账号以及全球风险库,从而精准识别不良内容风险,实现高效、准确、全面覆盖的内容审核过滤。智能审核应用与发展特点:通

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号