科技日报社激发数据要素价值,树立媒体行业数字化转型标杆

在这里插入图片描述

更多案例研究与行业报告,请前往爱分析官网

媒体行业企事业单位在数据要素领域得天独厚,日积月累的新闻报道、媒资素材、读者反馈和市场研究,沉淀出属于它们的“数据金矿”。

但是,多数相关单位尚未重视和发挥数据要素价值,导致资源闲置。闲置的数据要素既无法赋能内部业务团队,也无法通过对外输出来实现社会和商业价值。这种对数据只存不用的行为,导致媒体行业的“金矿”逐渐变成为“包袱”。

科技日报社作为媒体行业激发数据要素价值的先行者,已构建完善的数据基座和能力输出体系,在提升业务团队工作效率、对外输出实现创收等方面取得显著成绩,具有标杆意义。

01 数据底座+内外服务,科技日报社描绘数据要素价值实现蓝图
科技日报社(以下简称报社)是中央编委批准设立、由科学技术部代管的副部级事业单位,是承担党和国家科技宣传任务的中央主流媒体。报社作为科技信息传播的重要机构,拥有丰富的数据资源,充分释放数据资源价值,不仅能够提升报社的业务能力和市场竞争力,还能够更好地履行媒体的社会责任,带来更广泛的影响。基于此,报社通过梳理现有系统和数据资源,总结出构建数据底座、对内服务、对外输出三大需求。

需求一 以知识体系为骨架,构建数据底座

报社在科技资讯领域积累大量数据,既有自己生产的,也有积累的外部资料。这些资料交织混杂,检索不便。报社需要以当前的数据资源为基础,以知识体系为框架,来构建数据底座,旨在为后续高效利用数据资源打下坚实基础。

对于数据资源使用者而言,即需要过往数据的支持,也需要了解科技资讯领域的最新进展。报社需要按照新建的知识体系纳入外部资源,不断扩充和更新,保障数据底座的持续可用性。

需求二 以灵活取用为目的,实现对内服务

构建数据底座不是目的,用起来才是目的。数据底座的作用在于收集、管理数据资源,因此报社需要开发用户端,让大家可以灵活取用。编辑和记者们写文章或者报告时,往往需要查询资料,通过用户端可以从分门别类的高质量数据资源中高效检索出所需材料,提升产出效率和质量。为进一步提升灵活性,除Web端外,报社需要构建APP端。

需求三 以满足客户偏好为原则,实现对外输出

报社数据资源不局限于自用,也可以面向科技口的政府部门和企事业单位输出,实现创收。不同于对内服务,对外输出有其独特性。首先是服务方式,对内服务的Web和APP两端本质是一种SaaS服务,对外输出时,部分客户会接受,其他客户可能更青睐API的服务方式。另外,客户可能不满足于常规内容服务,会存在定制化需要。例如某单位对“大模型”比较感兴趣,希望精准定制大模型专题内容以及数据分析结果。因此,报社需要为这些高潜力需求进行准备。

02 拓尔思三大亮点促成与报社的深度合作
面对上述需求,科技日报社决定外采方式来实现。报社调研多家厂商后,研判选定拓尔思为合作伙伴,主要看重拓尔思的三个亮点。

亮点一 兼具媒体行业和大数据技术双重能力

拓尔思成立于1993年,已服务10000余家企业级用户。媒体是拓尔思的深耕行业之一,在该行业,拓尔思服务过多家类似于科技日报社的客户,积累大量行业Know-how和最佳实践。同时,拓尔思在大数据领域有深厚积累,已推出海蜘分布式数据采集系统、海聚数据整合系统、TRS海贝搜索数据库等多款产品,在广泛落地应用。科技日报社看重厂商在媒体行业和大数据方面的积累,更青睐复合背景的合作伙伴,因此未选择纯粹的媒体数字化服务商和大数据公司。

亮点二 积累千亿级高价值精准资讯数据

报社的数据底座必须坚实深厚,方能支撑起应用的大厦。仅依赖报社自己的数据积累,略显单薄。拓尔思服务媒体行业多年,积累千亿级高价值精准资讯数据,可以结合报社知识体系特点,让其数据底座迅速充盈。

并且,拓尔思拥有全球部署的分布式采集平台及核心采集能力,可以为数据底座快速构建连接资讯世界的管道,保证数据底座的持久生命力。

亮点三 支持报社现场调研过往最佳实践

拓尔思积累大量最佳实践案例,其中不乏与科技日报社类似背景的单位。拓尔思长期服务这些客户并保持良好关系,他们大多支持拓尔思与科技日报社现场交流、调研。报社非常重视实地调研,认为通过此方式可以切实感受项目价值,并能从中汲取宝贵的实践经验。

03 报社确认“三步走”的解决方案,让需求逐一落地
经过多方调研,报社和拓尔思制定“三步走”的解决方案。步骤一,打造大数据支撑服务平台,实现数据的梳理、加工和整合工作。步骤二,构建服务平台,实现内外服务。步骤三,打造精准专题生成服务平台和智能数据平台,深化对外服务。

步骤一 打造大数据支撑服务平台,实现数据的梳理、加工和整合工作

拓尔思基于报社实际情况打造专属知识体系,涵盖科委体系、科协体系、中科院体系、IT、农业科技等多种类型和维度。打造完知识体系后,拓尔思对数据进行清洗、整合入库。然后将外部高质量数据的标准化统一接入,进一步丰富基础数据资源。

上述构想将由大数据支撑服务平台来承载,该平台包括科技资讯采集接入子系统、科技数据智能处理子系统、大数据管理子系统和科技知识加工子系统四个组成部分。

科技资讯采集接入子系统:针对多源异构数据的接入,将推送数据进行多源、多时态、多尺度的整合,最终形成资讯内容大数据资源池,作为基础的数据服务支撑。
科技数据智能处理子系统:通过大数据智能处理技术手段对基础素材库进行语义分析、标签自动标引、信息分类、聚类等大数据智能处理。
大数据管理子系统:提供数据的存储管理、检索服务与数据管理,支撑后续上层平台的移动端业务应用。
科技知识加工子系统:从科技新闻、科技人员、科技机构、科技成果等多方位考虑,进行科技领域知识的信息收集及关键数据抽取,构建科技资讯所需的基础信息知识库。
步骤二 构建服务平台,实现内外服务

第一步的成果是让各方看见数据,第二步是让各方用起来数据。拓尔思在大数据支撑服务平台之上构建中国科技资讯库Web端和移动端。同时,拓尔思为报社构建中国科技资讯库后台管理系统,包括Web端和移动端数据的统一管理、用户会员管理、应用端运营管理、用户画像等。

通过以上建设,报社既可以对内提供服务,也可以为政府部门、企事业单位和各类社会组织的决策、运作提供科技资讯移动服务,以及为社会公众提供科技资讯和科学普及知识服务。

步骤三 打造精准专题生成服务平台和智能数据平台,深化对外服务

客户可能不满足于常规内容服务,存在定制化需要。拓尔思为报社搭建精准专题生成服务平台,用于满足该需求。平台依托拓尔思专题追踪、热点发现、线索聚合、传播指数计算、可视化轨迹溯源等人工智能和大数据分析技术,构建精准资讯专题,分别支撑不同的业务场景,包括电子报专题、原创稿件专题、宣传发行矩阵、领导动态专题、科技政策专题、重大科技直播专题、视频媒资专题、科技热点专题、事件分析、线索舆情专题、突发事件专题、新媒体榜单、数据服务统计、用户画像专题、央媒对比专题等。

部分科技口的企事业单位会接受Web和APP端,而更多的单位青睐API的服务方式。因此,拓尔思为报社打造智能数据中台,相关工作包括建立API的统一管理体系及标准规范,以及对API进行显性化、可视化处理。

04 报社数据服务覆盖31个省科技厅局、高新区及有关科研院所等单位机构,创收超预期
发展至今,科技日报社的数据底座共接入近8000个信源,包括网信办白名单、重点科技信源、科技日报社及国外重点基础信源等。其资讯总量已达到2.3亿条,为报社新闻资讯留存、新闻生产支撑和数据资讯服务等方面提供了有力支撑。

科报大数据科技资讯服务平台服务应用目前已覆盖了生物、医药等行业领域,并且能够针对特定高端用户实现精准数据推送。目前,移动终端覆盖了全国31个省科技厅局、高新区及有关科研院所等单位机构。在对外服务方面,报社实现超预期创收。

未来,报社计划引入大模型技术,为数据要素插上AI的翅膀,实现更大价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/788230.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LLM应用构建前的非结构化数据处理(三)文档表格的提取

1.学习内容 本节次学习内容来自于吴恩达老师的Preprocessing Unstructured Data for LLM Applications课程,因涉及到非结构化数据的相关处理,遂做学习整理。 本节主要学习pdf中的表格数据处理 2.环境准备 和之前一样,可以参考LLM应用构建前…

车载聚合路由器应用场景分析

乾元通QYT-X1z车载式1U多卡聚合路由器,支持最多8路聚合,无论是应急救援,还是车载交通,任何宽带服务商无法覆盖的区域,聚合路由器可提供现场需要的稳定、流畅、安全的视频传输网络,聚合路由器可无缝接入应急…

Flutter-实现物理小球碰撞效果

效果 引言 在Flutter应用中实现物理动画效果,可以大大提升用户体验。本文将详细介绍如何在Flutter中创建一个模拟物理碰撞的动画小球界面,主要代码实现基于集成sensors_plus插件来获取设备的加速度传感器数据。 准备工作 在开始之前,请确保在pubspec.yaml文件中添加senso…

未羽研发测试管理平台

突然有一些觉悟,程序猿不能只会吭哧吭哧的低头做事,应该学会怎么去展示自己,怎么去宣传自己,怎么把自己想做的事表述清楚。 于是,这两天一直在整理自己的作品,也为接下来的找工作多做点准备。接下来…

rsync远程同步--累了,明天继续再写~。

rsync官网链接 rsync(Remote Sync,远程同步)开源快速备份工具,是一个用于本地和远程文件同步的Unix-like命令行程序。它使用“快速数据传输算法”,只发送源和目标之间的差异,因此数据传输非常高效。 可以在不同主机之间镜像同步整 个目录树…

[安洵杯 2019]easy_serialize_php

源码&#xff1a; <?php$function $_GET[f];function filter($img){$filter_arr array(php,flag,php5,php4,fl1g);$filter /.implode(|,$filter_arr)./i;return preg_replace($filter,,$img); }if($_SESSION){unset($_SESSION); }$_SESSION["user"] guest; …

JRE、JVM、JDK分别是什么。

JDK JDK的英文全称是Java Development Kit。JDK是用于制作程序和Java应用程序的软件开发环境。JDK 是 Java 开发工具包&#xff0c;它是 Java 开发者用来编写、编译、调试和运行 Java 程序的集合。JDK 包括了 Java 编译器&#xff08;javac&#xff09;、Java 运行时环境&…

VUE中ECharts提示框tooltip自动切换

目录 前言1导入插件2定义参数3 插件API 前言 使用VUE开发的数据大屏统计&#xff0c;又需要将 echarts的提示框 tooltip 实现自动切换&#xff0c;网上有个很简单的插件&#xff08;echarts-tooltip-auto-show&#xff09;&#xff0c;使用教程简单分享给大家。 自动每隔几秒切…

LeetCode热题100刷题10:46. 全排列、78. 子集、17. 电话号码的字母组合、39. 组合总和、138. 随机链表的复制

回溯问题 46. 全排列 全排列问题&#xff1a; path 递归终止条件&#xff1a;path中是否已存储所有元素&#xff1b; for循环处理节点集合&#xff1a;used0未被使用的元素 class Solution { public:vector<int> path;vector<vector<int>> res;void backt…

【深度学习基础】MAC pycharm 专业版安装与激活

文章目录 一、pycharm专业版安装二、激活 一、pycharm专业版安装 PyCharm是一款专为Python开发者设计的集成开发环境&#xff08;IDE&#xff09;&#xff0c;旨在帮助用户在使用Python语言开发时提高效率。以下是对PyCharm软件的详细介绍&#xff0c;包括其作用和主要功能&…

『大模型笔记』GraphRAG:用于复杂数据发现的新工具现已在GitHub上发布

GraphRAG:用于复杂数据发现的新工具现已在GitHub上发布 文章目录 一. GraphRAG:用于复杂数据发现的新工具现已在GitHub上发布1. 评估和结果2. 研究见解和未来方向二. 参考文献一. GraphRAG:用于复杂数据发现的新工具现已在GitHub上发布 下载 GraphRAG今年早些时候,我们介绍…

Qt Creator仿Visual Studio黑色主题

转自本人博客&#xff1a;Qt Creator仿Visual Studio黑色主题 1.演示 配置文件和步骤在后面&#xff0c;先看成品&#xff0c;分别是QWidget和QML的代码编写界面&#xff1a; 2. 主题配置文件 下载链接&#xff1a;QtCreator _theme_VS_dark.xml 也可以自己新建一个xml文件&…

【每日一练】python基础入门实例

""" 幼儿园加法练习题 题数不限 每满100分奖励10个棒棒糖 要求&#xff1a; 1.使用三目运算符与基础运算的对比 2.随机数字相加 3.调用函数 4.循环执行练习题 5.有计算分数 6.有时间停止休眠 """ #导入随机模块 import random #导入时间模块 imp…

Data-Juicer:阿里巴巴荣誉出品的大模型数据清洗框架

Diffusion Models专栏文章汇总:入门与实战 前言:如何优雅地进行大规模数据清洗是一门艺术,特别对于大模型,数据的质量是决定模型成功最关键的因素之一。阿里巴巴最近开源了一项专门针对大语言模型和视频生成大模型的数据清洗框架,值得关注! 目录 主要特点 数据处理 分…

2.17分一区文献精读:机器学习:乳腺癌预后预测的统计和机器学习模型的开发及内外部验证:队列研究-摘要

#精医求精&#xff0c;文献阅读 大家好&#xff0c;我是蔡老师&#xff0c;一个立志学会所有医学大数据分析模型的女子 今天我们从文献阅读开始 这篇文章的影响因子为17分&#xff0c;全文名称为《Development and internal-external validation of statistical and machine l…

如何让 3D 数字孪生场景闪闪发光

今日图扑软件功能分享&#xff1a;我们将探讨 HT 系统如何通过分组管理灯光、裁切体和流光&#xff0c;以提高场景光影效果的精准度和整体可控性。 HT 中的灯光、裁切体、流光是会影响它所在区域一定范围内的其他节点的表现&#xff0c;如 场景中有个 A 灯光&#xff0c;默认情…

C++入门基础(2)

目录 一、引用: 1、定义&#xff1a; 2、特性&#xff1a; 3、引用的使用&#xff1a; 4、const引用&#xff1a;控制权限 const引用定义: const引用可以接收3种对象&#xff1a; 1、正常对象&#xff1a; 2、临时对象&#xff1a; 3、const对象&#xff1a; 总结&…

leetcode--层数最深叶子节点的和

leetcode地址&#xff1a;层数最深叶子节点的和 给你一棵二叉树的根节点 root &#xff0c;请你返回 层数最深的叶子节点的和 。 示例 1&#xff1a; 输入&#xff1a;root [1,2,3,4,5,null,6,7,null,null,null,null,8] 输出&#xff1a;15 示例 2&#xff1a; 输入&#xff…

SpringSecurity中文文档(Servlet Method Security)

Method Security 除了在请求级别进行建模授权之外&#xff0c;Spring Security 还支持在方法级别进行建模。 您可以在应用程序中激活它&#xff0c;方法是使用EnableMethodSecurity 注释任何Configuration 类&#xff0c;或者将 < method-security > 添加到任何 XML 配…

c++ learn third day

1.津津的储蓄计划 参考&#xff1a;http://t.csdnimg.cn/XI1HV 记得最后加上num&#xff01;&#xff01;&#xff01; #include<stdio.h> int main() {int arr[13]{0};int num0,i0,j;double sum0;for(j1;j<12;j){scanf("%d",&arr[j]);}for(i1;i<…