澳门新金沙官网(官网) 诸暨人业余时间做公益网站 成古籍汉字最强数据库

2019-12-22 18:24:12 4995次浏览

导读:   市交警大队提醒,很多人以为喝了一点酒开车没事,其实已经达到酒驾标准。接下来,交警大队将不定时采用这种新颖、直观的方式,走进酒店,从“源头”开始宣传,以此增强市民们“杜绝酒驾”的安全意识,确保形成“开车不喝酒,喝酒不开车”的良好局面。

澳门新金沙官网(官网) 诸暨人业余时间做公益网站 成古籍汉字最强数据库

澳门新金沙官网(官网),当许多人听到“国学大师”这个词时,他们可能会想到像王国维这样的国学大师。

互联网上有一个名为“中国研究硕士”的网站。它整合了20,000多种经典书籍,280,000册,约24亿字,纯文本大小约6.5g,是中国最大的非营利性数据库,也是对免费检索古籍和汉字影响最大的网站。目前,“中国研究硕士”的全球用户每天访问数以万计的知识产权。

创建该网站的创始合伙人是“诸暨木柁”李勇。

为什么这个网站被命名为“中国研究硕士”?李勇表示,该网站从最基本的小学字典开始,以满足每个传统知识爱好者在各个阶段的需求,“让每个人都有可能成为语文学习的大师。”

他带领志愿者做了一件令人惊奇的事情。

李勇,1975年生于荔浦,绍兴文理大学浙江越文化研究中心兼职副研究员,中国Xi石文化研究中心研究员,绍兴市哲学社会科学专家库成员,诸暨作家协会成员。他出版了《诸暨太平天国——以包村为中心》、《诸暨崖铭集成》等研究专著。

最近,他和阮江恩共同创作了《诸暨悬崖碑铭集》,并在绍兴市获得了第九届“蔡元培社会科学奖”。

邵昌平于2014年创建了“中国学硕士”网络。其初衷是成为一个公益性的免费数据共享网站,主要提供字典咨询功能。

“当时,它是一个拥有200名用户的非常小的网站,我就是其中之一。很久以后,我和网站管理员成了好朋友,所以我一起做了一些网站修改。慢慢地,用户数量在增加,网民的需求也在增加。由于服务器之间的关系,这些要求变得有点过分,所以我有升级服务器的想法。”李勇的记忆。

由于它是一个纯粹的私人公益网站,没有任何收入,资金已经成为最大的问题。当时李勇相对富裕,所以他资助网站购置了一些硬件设施,在上海的机房里设置了一个下载服务器,主要为古籍提供下载服务。因此,李勇成为了“中国学硕士”网络的创始伙伴。

“在字典服务上,我们开始构建更快、更方便的部件进行拆卸和查询。这是一项有大量数据的工作,所以我召集了一群志愿者,在众包方法中,只花了一个月的时间就完成了看起来几乎不可能完成的工作。cjk的a、b、c、d和e区域中超过20万个涉及unicode的汉字被分成零碎的部首甚至笔画。用户可以通过输入汉字的任何部分找到相关组合中的所有汉字,这对于搜索困难的字符来说是非常方便的。”

后来,另一名志愿者网民制作了一部甲骨文在线词典。只要输入甲骨文的编号或文字,就可以找出这个词曾经出现在哪个甲骨文中,并且可以直接浏览这个甲骨文或钟鼎的照片或拓片,这对专业研究人员来说是极其方便的。

事实上,做一个网站是非常困难的,“因为它是一个业余网站,很多事情都不是很完整,加上访问量巨大,网站经常崩溃,所以我们只能不断更新设备和完善程序。”

有时,会有来自同行或网络公司的恶意攻击,甚至是非法信息的报告。有一次,他接受了上海市网络和信息安全部的采访,理由是据报道他在古籍中含有非法信息。“幸运的是,安全部门意识到了这件事,并且非常体谅我们。这并不难。然而,其结果是我们删除了明清小说的大部分书面版本,因为如果它们存在,它们可能会继续被报道。”

许多人问李勇,如此努力地建设一个没有任何经济效益的公益网站,值得不值得,累不累?“累了,肯定会很累,不管数据的基本维护,每天都要在数百名网民面前提问和交流,这要花很多时间。”至于它是否值得,他说,“世界上很多东西都不能用金钱来衡量。”

成为中国最大的非营利数据库

目前,“国学大师”网络整合了2万多种经典书籍,28万册,约24亿字。该数据库的纯字符大小约为6.5g,是中国最大的非营利数据库。“国学大师”网站分为11个主要部分,即历史、佛教、诗歌、儒学、彝族、艺术、医学、聪、道、佛。它基本上包括中国常见的古籍。它是目前最全面和最全面的图书整合网站,包括互联网上的经典文学作品。它提供免费和无门槛的在线访问和下载。

汉学大师网自主开发的部件字搜索系统可查询20万个汉字,支持unicode cjk扩展区域A、B、C、D、E,连接近60种工具书,包括《汉语词典》、《汉语词典》、《现代汉语词典》、《康熙词典》、《说文解字》、《古代汉语词典》、《苏洵汇传》、《古汉字古林》、《说文解字古林》、《汉语词典》、《宋本广韵》、《形态演变》等。,实现检索到的字符和图像的同步。

经过几年的发展,“中国学硕士”在国内外产生了巨大的影响。主要大学的教师将向学生推荐网站和相应的应用程序和讨论组。来自韩国、日本、加拿大和新加坡的汉学研究人员经常在信息区留言,讨论相关问题。

在中国,大多数大学历史、文献学、文献学等与汉语相关的专业,教授都会向学生推荐“中国学硕士”数据库,尤其是文本。专业志愿者团队将不断改进在线词典系统,并可以查询包括甲骨文在内的大多数类型的字符。

“有人曾经开玩笑说,如果我们组没有人能认出古代汉字,那么基本上没有人能认出它们。”李勇对此非常自豪。

让每个人都有一个免费的在线图书馆。

2018年3月,李勇还应邀参加了哈佛大学主办的“中国历史研究网络基础设施国际研讨会”。本次会议的目的是为网络基础设施建立一个国际标准,以解决汉学数字化问题。会上,李勇向世界各地的大学和研究人员介绍了“中国研究硕士”网站的运行情况和数据库。在场的许多学者告诉李勇,他们都在使用“汉学大师”数据库学习汉学。

2018年3月,在“中国历史研究网络基础设施国际研讨会”上,李勇(右)与日本京都大学克里斯蒂安·威腾(左)教授合影。

最让李勇感动的是,日本京都大学的克里斯蒂安·威腾(christian wittern)教授来到李勇的小组会议上,告诉李勇,他和他的同事是“中国研究硕士”网站的忠实用户。他们每天祈祷“中国研究硕士”网站一定要强大,不要关闭。如果它关闭了,他们都不知道该怎么办。由于网站的运行是个人兼职管理,服务器经常超载,访问有时会中断

在那次会议上,李勇交了许多朋友,并与许多组织保持联系。他还与许多组织交换数据。例如,日本京都大学生产的“四库全书”图形比较系统,由于版权问题不能上网,他们把它带到我们这里上网,从而拥有了中国最好的免费“四库全书”全文检索图形比较系统

在数据库方面,目前“中国学硕士”网络可以共享哈佛燕京图书馆数据库、上海家谱数据库、中国地图古籍数据库等各种在线数据。通过开放接口。目前,该网站仍在不断扩大,以提供更高效的查询服务。

“我们一直计划制作一部权威的在线词典,超越《汉语大词典》。”李勇说,“我们的最终目标是每个人都有自己的免费在线图书馆。”

平博