JJason 发表于 2007-3-24 20:01

CvtCNKI v2.0.2.B3 发布

这是 CvtCNKI v2.0.2 的第三个 beta 版本。这个版本主要修正了两个比较重要的 bug ,这两个 bug 都是在转换万方数据库的时候发现的。第一个 bug 仍然是匹配关键词出现的错误;第二个 bug 是发现转换后丢失一些信息。目前这两个 bug 都已经得到修正。

目前处理万方数据库还有点问题。

问题之一是,万方数据库的检索结果文件编码格式为 utf8 no bom,这种文件格式无法处理。具体的原因我在前面的文章已经提到。对于这个问题解决得办法是,打开文件,将其中的内容复制到剪贴板(内存),然后在 CvtCNKI 上点击剪贴板,即可直接从剪贴板中读取数据,进行转换;或者新建一个文本文件,将原来的内容复制粘贴过来,将文件保存为 UTF with BOM 或者 GB2312 编码格式,然后使用 CvtCNKI 进行转换。

问题之二是,万方数据库部分版本数据结果包含断行符号,像前面网友反馈过来的信息里面这样,在 [分类号] 和 TU751.9 之间存在一个换行符,这种形式 CvtCNKI 无法处理。以后的版本我可能会修复这个问题,但目前无法处理。我怀疑该网友是直接复制的网页内容,建议采用万方提供 详细输出格式.txt 文件。

下载地址:http://gf.cs.hit.edu.cn/frs/?group_id=38

以下是更新列表:
2007.03.24 CvtCNKI v2.0.2.B3发布:
◇ 修正转换过程中丢失数据的错误。
◇ 修正关键词匹配函数。
◇ 修正几处不太重要的代码。

转载原创文章请注明:总而言之,统而言之[http://jiangzhanyong.com]
本文链接: http://jiangzhanyong.com/2007/03/cvtcnki-v202b3-release-240.html
页: [1]
查看完整版本: CvtCNKI v2.0.2.B3 发布