聚典知识搜索榜


聚典数据开放平台:为阅读赋能 为学习赋能 为搜索赋能

http://www.shcpg.com.cn/sjcb/bkview.aspx?bkid=282774&cid=841794

  聚典数据开放平台是赋能B端应用进而满足C端用户知识查检需求的互联网知识服务产品,开创了传统工具书数字化转型的新模式,由上海世纪出版集团规划设计,上海辞书出版社自行开发建设。

产品亮点
  响应用户查检需求,填补市场空白

  随着移动互联网的兴起,数字阅读在整体阅读市场中所占比例显著上升。移动阅读具有随时随地、随手可读的特点,传统纸质工具书无法满足用户在移动阅读时即兴的知识查检需求。独立的工具书数字产品,需要用户在阅读界面和工具书应用之间反复切换,操作不便,使用体验欠佳。融合多种专业工具书的“聚典数据开放平台”彻底解决了用户在数字阅读中便捷查检知识内容的需求痛点,填补市场空白。用户只需在阅读界面,选取想要查检的内容,发起调用请求,查询结果即刻呈现到用户界面,方便快捷。

  数据安全有保障,下游企业开发简易

  对于出版机构,在进行数字产品开发时,版权内容数据安全是其最担心的问题之一。以往出版企业在向合作方进行版权授权时,需要交付全部的数据内容,数据安全没有保障。但聚典数据开放平台采用数据云存储,SDK调用的方式提供知识服务,内容数据始终保留在自有平台内,版权安全得到保障。

  原有版权授权方式,将原始数据交付给下游企业,企业需花费大量精力对数据进行加工,搭建系统;授权给不同企业时,因技术标准差异,通常需要重新开发;若涉及多个专业学科门类的内容,非专业人士在处理过程中也容易产生错误。当出版社图书修订,数据更新时,又需要再次交付数据,重新加工,造成大量的重复开发和资源浪费。而聚典数据开放平台中的数据内容,始终由出版机构负责维护,能最大限度保证数据的准确性,且所有下游企业均以SDK方式调用,只需分别选配各应用所需的工具书即可,极大地减轻了下游企业的开发工作。该模式让出版机构立足自身优势,继续专注于优质、权威的工具书内容生产和数据维护,互联网企业专注于其擅长的产品运营和用户维护,各展所长,各尽其能,共建良性的知识服务产业链和生态圈,共同为用户提供优质的知识服务。

  清晰掌握用户数据

  在传统出版时代,或是直接交出全部数据的数字产品授权模式下,出版社对用户使用产品情况的了解非常有限。而在聚典数据开放平台上,出版社能清晰地获得用户的使用动态,每日使用人数,使用次数,查检热词,查询较多、而平台暂未收入的词等等,都能够清晰地获得。一方面,平台可根据这些信息,及时调整各项技术参数,优化配置,提供更加稳定、流畅的服务;另一方面,基于用户反馈,可以对内容进行针对性的增补和修订,能够向用户提供更加准确、丰富的内容,使之成为真正意义上的以用户为中心的互联网产品。

  该产品已获得产业链上下游的广泛认可。2019年11月聚典测试版上线,2020年8月正式版上线,截至2021年底,已有十几家出版社在平台开户,提供了近百种优质工具书,共计超过300万词条, 3亿多字内容。聚典也已向掌阅、起点读书、豆瓣阅读、咪咕阅读、上观新闻、澎湃新闻、中国搜索等20余家国内头部阅读应用、新闻咨询、搜索引擎提供数据服务。

主要技术
  聚典数据开放平台建设所需的云技术、API技术、分布式数据分析技术、知识标引技术、结构化加工技术、全文搜索技术等都已比较成熟,达到了项目实施的各项需求,用户体验日臻完美,为项目顺利实施提供了技术保证。

  聚典数据开放平台,实现了前端展示、内容资源管理、机构后台管理(机构管理、权限管理、接口管理)、用户后台管理、令牌认证、加密传输、软件开发包(SDK)、使用监控、统计报表、大屏展示等功能,成为目前国内领先、功能完备、技术先进的工具书数字出版平台。

  聚典数据开放平台在应用过程中不断更新迭代,一方面不断完善各项已有功能,另一方面根据市场反馈开发新的功能,如增加纪年换算、古今地名对照和英汉双语互译接口,内嵌搜索框到第三方App,以及根据客户需求对库中词典数据进行个性化排序输出等,使聚典的应用场景越来越丰富。

  在用户数据统计分析方面,目前数据大屏已经可以完整采集并分析终端用户(读者)、机构用户、供应商、词典、词条等各个级别和层次的瞬时数据、时段数据和长期数据,从而为内容建设、参数设置、产品运营和销售提供重要参考。

为进一步推动全民阅读,提高国民知识素养,聚典平台基于用户知识查检行为,于2023年4月21日,首次发布“聚典知识搜索榜”,榜单分汉语单字、词语、中国人物、外国人物、中国作品、外国作品等六类,每类选取查检频次最高的前30名,以系统反映数字时代的知识需求。

“聚典知识搜索榜”的创设推出,将填补中国权威工具书线上知识查检数据动态发布的空白,标志着上海世纪出版集团在融合出版领域实现了内容供给手段和知识服务模式的一次新突破。

“聚典知识搜索榜”发布

辞海网络版
2023-04-23 14:04上海
关注

2023年4月21日基于聚典数据开放平台用户知识查检行为的“聚典知识搜索榜”在上海首次发布。

聚典数据开放平台是由上海世纪出版集团规划设计、上海辞书出版社建设和运营的一款为阅读赋能、为学习赋能、为搜索赋能的互联网知识服务产品。平台聚合各类传统工具书的权威知识内容,整合互联网应用技术手段,融合构建了知识服务的产业链新模式,先后入选全国新闻出版深度融合发展创新案例、国家新闻出版署数字出版优质平台遴选计划,为4000多万互联网用户提供了近9亿次知识查检服务,被认为是互联网时代工具书整体数字化转型的有效路径与成功模式。

为进一步推动全民阅读,提高国民知识素养,聚典平台基于9亿次用户知识查检行为,首次发布“聚典知识搜索榜”,榜单分汉语单字、词语、中国人物、外国人物、中国作品、外国作品等六类,每类选取查检频次最高的前30名,以系统反映数字时代的知识需求。

一、汉字

排名前30位的汉字查询量基本都在20万次以上,全部属于二级字。国务院发布的《通用规范汉字表》一级字表为常用字集,收字3500个,主要满足基础教育和文化普及的基本用字需求。二级字表收字3000个,使用度仅次于一级字。三级字表收字1605个。分析“聚典”后台查询统计数据,我们可以看到,汉语字词是一般读者知识查询的主要方面,占比达到70%左右。针对汉字的查询,覆盖一、二、三级字,但前100位高频查检字都集中在二级字。这说明,一般读者对一级字表3500个常用汉字的掌握情况整体较好,故相应的查检需求并不显著,而次常用的二级汉字查检需求则非常凸显,这应该与基础教育的普及和全民文化水平的提升有密切关系,同时也说明,二级字表所收的次常用字,在当今日常语文生活的触达率也较高,我们在写作和阅读的过程中还会经常遇到。

二、词语

这些词语查询量基本都在10万次以上,全部是双音节词,除晚近来自方言的“拥趸”外,都是历史悠久、一直沿用的文言词,比如,“不啻”一词最早出现于《尚书》,在清华大学藏战国竹简《摄命》篇中也可见该词,“葳蕤”一词出自《楚辞》,“觊觎”一词在《左传》已见,《孟子》里就有“桎梏”一词。这些使用了二千多年的词语,给人典雅古奥的感觉,更有一定的历史和文化底蕴。在今天,尤其是在比较正式的场合和书面表达中还经常被使用,可见汉语文化绵绵不绝,中华文脉渊源有自。

三、 中国人物

搜索排行前30的中国人物,其中毛泽东和鲁迅属于现当代,其他皆为不同历史时期的古人,春秋战国时代有孔子、孟子、庄子、屈原、老子;两汉三国晋有陶渊明、曹操、司马迁、诸葛亮、王羲之;唐宋最多,有李白、苏轼、杜甫、王维、白居易、王安石、陆游、韩愈、欧阳修、朱熹、刘禹锡、辛弃疾、杜牧、李清照、范仲淹、柳宗元、孟浩然。群星闪耀、高峰连绵,同源共流、前后相继,他们在很大程度上代表了中国思想文化、文学艺术历史长河中曾经达到的高度和创造的辉煌,参与构建起中华民族的文明框架和文化谱系,是我们共同的精神家园,今天仍是我们汲取精神文化滋养的重要来源。

四、外国人物

搜索排行前30的外国人物,包括二千多年前的苏格拉底、柏拉图,一直到现当代的弗洛伊德、爱因斯坦。相对排名前30的中国人物,外国人物的构成更为广泛,哲学思想、文学艺术、科学技术、政治军事等都有涉及。他们跨越数千年,来自于不同的国度和领域,共同谱写了人类文明灿烂辉煌的历史。前30位中国人物和外国人物构成方面的差异,也说明了广大读者在日常阅读和知识检索方面的实际情况,对于自己的先贤,我们更聚焦于思想文化等精神方面的体认和传承,而对于外国的人物,我们更强调对在不同领域成就卓著人物的了解和把握。有异有同,所谓异,大概是前者更亲切而后者更全面,所谓同,就是对于人类杰出者的共同的敬仰。

五、中国作品

中国作品,儒家“十三经”有《诗经》《尚书》《易经》《礼记》《春秋》《论语》《孟子》入选,四大名著《红楼梦》《三国演义》《西游记》《水浒传》全部在列,大众比较关注的中医著作有《黄帝内经》《伤寒论》《本草纲目》,史书有《史记》《资治通鉴》等,还有《离骚》《说文解字》《世说新语》《山海经》等,值得一提的是,当代文学作品《三体》《活着》也有高频的查检需求。书以人成、人以书传,如老子和《老子》、庄子和《庄子》,李白杜甫和“李杜文章”,中国作品和中国人物两相结合,可以更好地展现中国优秀传统文化的整体面貌。

六、外国作品

外国作品大概也可分为两类,一类是学术著作,一类是文艺创作。学术著作方面,《理想国》《国富论》《资本论》《共产党宣言》《查拉图斯特拉如是说》《忏悔录》《沉思录》等作为影响人类文明进程的经典,历来是国内外各类阅读榜上的常客,对大众读者来说,对它们有所了解也是一种普遍的需求。文艺创作方面,《荷马史诗》《神曲》《失乐园》《唐吉诃德》《战争与和平》《追忆似水年华》《哈姆莱特》《麦田里的守望者》《百年孤独》等所谓经典中的经典拥有广大的拥趸,即使大部分人可能无法通读全书,却也始终代表着阅读趣味的风向标。同样的,外国作品也可和外国人物合观。

通过上面几份榜单所展示的大众阅读和知识检索的实际情况,我们可以看到,随着教育的普及和社会文化水平的持续提升,以及全民阅读的深入推进,我国大众阅读在呈现多元化的同时,对优秀传统文化和经典作品的阅读需求占据明显位置,呈现出良好的发展态势。

后续,聚典平台将不断根据知识查询大数据分类统计情况,定期发布数字阅读方面的各类榜单,总结阅读规律,分析知识需求,更好地服务全民阅读、建设书香中国。