首页 优秀范文 计算机工程导论论文

计算机工程导论论文赏析八篇

发布时间:2023-04-01 10:12:59

序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的计算机工程导论论文样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。

计算机工程导论论文

第1篇

关键词:家庭自动化系统计算机软件工程应用

中图分类号:TP273.5 文献标识码:A 文章编号:1007-9416(2012)03-0000-00

1、引言

随着计算机以及网络技术的发展,自动化在各行各业都发挥着重要的作用,而家用电子电器也逐步趋于家庭自动化。特别是在美国以及国际的市场中,家庭自动化系统有着广阔的前景,而国内也正处在成长期。家庭自动化系统本着以实现家庭住宅中各个设备之间的自动管理为目的,这种系统会在适应的时间对各个设备发出相应的指令,从而完成设备的自动化管理。在一般情况下,这种家庭自动化系统都有着灯光控制、环境控制、家电控制以及保安控制等功能来实现家庭的自动化管理。

2、家庭自动化系统在计算机应用中的可行性分析

在技术上,家庭自动化系统有着不同的传感器,以及单片机和报警系统以及接入的各种家电设备构成的。而物理设备在大型市场上均可购得,主要是实现不同设备之间按一定结构连接起来。无论是在法律因素还是用户使用可行性上,经过分析,家庭自动化系统是有合同作为双方合作的基础,而系统也是主要面向高阶层的消费者使用的。从以上多种角度来看,家庭自动化系统都具有其可行的。

3、家庭自动化系统的需求分析

在家庭自动化系统中有着自身一套工程流程,用户登录时进行检查,同时控制不同用户的使用权限。还有对用户信息有着增加、修改以及删除的管理功能,以及可以设定指定时间内对操作记录进行包括查看以及删除和自动清除等在内的管理。对设备的状态进行查看,以及对设备进行监控,包括对其进行启动、停止等监控操作。

家庭自动化系统的非功能性需求分析。(1)快速的系统反应。在进行家庭自动化系统的设计中,应采用较为先进的网络技术手段,同时在应用软件的选择时也应尽可能采用先进技术,从而保证系统的快速反应。(2)保证系统具有良好的可维护性和开放性。由于家庭自动化系统在国内处于初期发展阶段,在系统设计时要考虑到其发展的趋势。(3)要绝对的保证系统的安全性。在家庭自动化系统中的设备具有安全性要求,故此须建立一套系统的安全保密措施,防止非法访问。(4)要考虑到用户的操作方便,要具有友好的人机界面,最大限度的方便用户去使用。

对于家庭自动化系统的功能需求分析,初步设想可以包括用户登录子系统,灯光控制子系统,环境控制子系统以及保安控制子系统和家电控制子系统。对于保安控制包括门窗监控以及视频监控来实现。环境监测主要是对室内外温度以及湿度的监控以及调节。

4、家庭自动化系统的总体设计分析

在对家庭自动化系统的总体设计时,主要是进行处理流程设计,总体结构和模块外部设计,数据结构和接口设计,运行以及出错处理设计内容。特别是对数据结构的设计,在系统中采用数据库的三级模式结构,三级模式是指外模式以及模式和内模式三级构成。数据库的三级模式对应的是数据的三个抽象级别。同时为了能够在内部实现这三个抽象层次间的联系以及转换,在数据库系统的三级模式间提供了两层映像。当然,在数据库设计时需要考虑的原则有,命名的格式规范,索引的使用以及数据的一致性和完整性。其次,对主要表结构的设计时应做到一下几个方面:关系的映射可能有多种情况,但一般情况下是一个表,而对于条件关系的映射,一个表至少应有三个属性。减少表之间的冗余字段以及对映射后的表进行冗余控制调整也是必要的。

另外,对于运行设计时,一般有三方面的内容:包括系统用户或者是一般用户通过登录程序登录到家庭自动化系统中,其次,用户可通过菜单选择要执行的相关操作。用户从子系统传送过来的请求,通过服务器端控制程序进行解析,并最终将处理结果返回给主系统。当系统在运行或者执行过程中出现异常情况时,系统这时候要有能力自动检测到并进行相应的处理或者形成有关的报告返回给用户进行相关恢复处理操作。当然,在家庭自动化系统中也有相关的出错处理对策,如联机事务处理,数据库处理事务失败自动回滚技术以及重要数据的校验检查等。

5、结语

随着国内房屋的商品化以及人民生活水平日益提高,信息化的产业也逐步渗入到各行各业之中,而人民也多希望家庭更加舒适以及安全和简便。然而,家庭自动化系统就是利用了计算机技术以及各种先进的网络技术,将家庭内的各种设备以及家电有机的结合在一起,通过自动化管理,从而达到人民所希望的家具生活。文中只是对家庭自动化系统的产品简单阐述,还有像系统中的详细设计以及系统的测试方案等等都未进行阐述,这也需要更多学者共同来研究完成,使家庭自动化系统更加优化。当然,家庭自动化系统由于国内市场广阔,如果本系统在安全系统以及故障处理系统更加优化以及能提供更完善和更人性化的措施,当本系统投入市场也将风靡国内市场。

参考文献

[1]李伟强等.家庭自动化系统[J].计算机工程,2007.

[2]李云洪.《家庭自动化系统的研究与实现》[A].同济大学工程硕士学位论文,2006.

[3]张海藩.《软件工程导论》[M].北京:清华大学出版社,2008.

第2篇

(1.东南大学成贤学院 计算机工程系, 江苏 南京 210088;2.南京大学 信息管理学院,江苏 南京 210093)

摘 要:为了在程序设计课程中有效地培养学生的应用及工程能力,提出基于CDIO理念的教改思路,以C#程序设计课程为载体,建立理实合一、阶梯式学—做—学的迭代教学模式并构建多元化的综合考评体系。

关键词 : CDIO;C#程序设计;教学改革

基金项目:2014年江苏高校哲学社会科学研究基金指导项目“工程思维导向的独立学院软件工程课程群实践教学模式探索”(2014SJD038);2014年东南大学成贤学院教学研究与改革项目“基于CDIO理念的《C#程序设计》教学模式探索与实践”(院教学[2014]08号)。

第一作者简介:谢修娟,女,讲师,研究方向为软件工程,xiujuan__xie@126.com。

0 引 言

“中国拥有世界上最大规模的工程教育体系和最大的工程人才需求市场,也拥有非常丰富的工科生源,这是中国工程教育的优势”[1] 。然而,理论与实践脱节是我国高等工程教育中普遍存在和亟待解决的一个瓶颈问题,进行工程教育模式的理论研究和实践探索具有重要意义。

CDIO(conceive—design—implement—operate)工程教育模式是由美国麻省理工学院、瑞典皇家工学院等4所大学历时4年探索研究建立的现代工程教育模式,其核心理念是围绕生产周期中工程产品的构思、设计、实现、运行等各个阶段,以过程为载体,培养学生的工程思维能力、个人能力、团队协作能力以及工程系统能力[2] 。

自2005年起,我国已陆续有50多所院校开始学习、研讨和实践基于CDIO理论的工程教育模式,取得明显的效果;既重视技能的培养,又关注职业素质提高,尤其注重学生项目开发、设计及建造能力、创新能力、团队协作与领导能力的培养。目前,计算机程序设计类课程教学依然存在以下问题:①理论与实践脱节,实践课时不到总课时的1/4乃至更少,没有安排应用型实践;②实验实践与应用实践脱节,实验多以验证性为主,缺少探索性,脱离实际应用,每个实验基本是针对不同知识点孤立进行,缺乏关联性、真实性、综合性和实战性;③教师引导与学生主动学习脱节,以“教”为主,以“学”为辅,“教”是“满堂灌”“填鸭式”“唯教材”, “学”是“督促式”“压迫式”,学生缺乏自主学习的原动力、激励措施和自由空间;④知识教育与素质教育脱节,学校只注重或只满足于完成知识教育,把对学生的评估重心放在理论知识考核上,忽视对学生沟通能力、团队合作能力、创新能力等综合技能的考核[3-4] 。

1 基于CDIO理念的C#程序设计课程教学改革思路

C#程序设计是计算机专业的一门程序设计基础课,集知识与技能为一体,有很强的实践性和应用性。课程既要求学生掌握程序设计语言的理论知识,又要求学生具备实际应用能力和操作技能。借鉴CDIO理论在背景、课程开发、设计经验及工作环境、教学/学习的新方法、教师发展、评估/评价6方面提出的12条标准[5],尤其是第3条、第7条、第8条和第11条,我们将C#程序设计课程教学改革思路与其进行匹配。

1)标准3:一体化课程设置。

一体化课程强调不同课程之间的关联性。C#程序设计是专业学科中的桥梁课程,该课程的教学设计需要与先修课程及后继课程有机地联系起来,变各门课程间的“松耦合”为“强耦合”,保证专业知识链的连贯性。例如,东南大学成贤学院计算机工程系的教学计划就为C#程序设计课程及关联课程建立自顶向下的以软件开发为主线的3层课程群结构:第1层是基础课程(计算机导论、C++、数据结构),是当前课程的先修课程,使学生具备基础的结构化编程及算法设计能力;第2层为专业主干课程(C#程序设计、软件工程、数据库原理及应用),包括当前课程及平行课程,目标是培养学生面向对象的高级编程能力、数据库设计能力及系统工程化思想;第3层为专业方向课程(项目管理、软件体系结构、WebService),是当前课程的后继课程,培养学生系统地利用现代项目管理知识进行项目开发、系统架构、网站开发等技能。

2)标准7和8:综合性学习经验、主动学习。

综合性学习经验不仅是学科知识的学习,还应包括个人能力、人际能力、软件产品的构造能力等。教师应通过改进教学方式,激发学生主动学习的积极性。第一,尝试多元化教育,哈佛大学教授加德纳提出“多元智能理论”[6]:每个学生个体的智能分布不尽相同,教师应善于发现并挖掘每个学生的强项,针对他的兴趣、特长在掌握课程基础内容的前提下安排个性化的作业和实践环节,合理地分配角色,实现因材施教;第二,教学过程中坚持以学生为主体,以教师导、评为主,教师将学习目标告知学生,给学生留有足够的学、思、练时间;第三,倡导启发式、项目驱动式教学,教会学生获得知识的途径和方法;第四,重视非智力因素的作用,帮助学生树立正确的人生价值观,与学生建立良好的师生情感,正面促进学生智力水平的发挥,提高教学质量。

3)标准11:学生考核。

改变传统只围绕一本教材知识的一张试卷定成绩的做法,采用综合测评方式评价学习成果。综合评价体系包括基础知识测评、技能测评、应用能力测评、创新创造能力测评、职业能力测评等方面。知识测评着重基础和思维,不出难题、怪题、偏题、边角题,宜多采用开卷考试,允许学生查书或参考资料,不规定标准答案,允许学生正常理解和发挥。知识考试成绩比例不超过30%;技能、应用、创新、职业能力测评成绩比例应占50%以上,以任务完成情况和实验报告为考核形式。

2 C#程序设计课程教学改革方案(试验版)

鉴于目前诸多高校程序设计课程教学存在理论与实践脱节、实验实践与应用实践脱节等问题,教师可将理论知识融入实践中,实现“基于项目的学习”“学中做、做中学”。按照先基础操作能力、后工程能力,再团队交际能力培养的思路,C#程序设计课程的教学分为基础能力培养、综合型系统能力训练和开放型项目拓展3个阶段,环环相扣,递推式前进,前一阶段是后一阶段的基础,整个过程是一个“学—做—学—做—学......”循环往复的过程,最后通过科学、多元的综合考评体系,对学生每一阶段的学习情况进行考核。

1)基础能力培养。

该阶段主要训练代码编辑、程序调试、开发工具使用等基本操作能力,采用任务驱动式机房教学,将理论授课与传统的验证型实验融为一体,讲练交替,每次课堂教学按照“提出任务要求—介绍相关知识点—使用知识点解决问题—举一反三”的方式进行。C#程序设计课程的知识点及对应任务案例的初步设计见表1。

任务是学生能够直观感受到的一个开发“情景”。教师通过任务要求引出当堂课程的知识点,讲解这些理论知识并演示如何运用知识点实现任务。最后的“举一反三”环节是紧扣当前知识点设计的简单验证型实验,让学生运用前面的方法完成类似的任务,是一次知识的巩固过程。任务驱动式教学方式强调学生的主体地位,更能激发学生的学习兴趣和热情。

2)综合型系统能力训练。

阶段二是阶段一的一次提升,对本课程的所有知识点分模块内聚,每个模块选用一个具有一定实用意义的小型开发项目,将知识点融入到项目的各个任务/子任务中,同时有机结合课程群里关联课程的内容。教师指导学生按照软件工程生命周期的思想开展项目。每个项目按C—D—I—O分4步进行,以综合项目“基于控制台的单词竞猜游戏”为例(涵盖表1中K1—K18知识点),第1步(构思)通过试玩类似游戏、头脑风暴等方式,构思本游戏的功能并编写需求说明书;第2步(设计)要求学生作出游戏的总体及详细设计方案,包括游戏界面说明,实体类、业务类、数据访问类的设计等,并编写设计说明书;第3步(实现)按照设计说明书的要求编写代码;第4步(运行)对实现好的游戏进行测试,及时改正测试过程中的错误,同时鼓励学生对游戏再添加一些个性化的创新设计,即完善游戏,最后完成程序部署。

3)开放型项目拓展。

本阶段是教学环节的又一次升华,集C#知识应用、工程思维能力、团队协作能力、个人职业技能于一体。该阶段按照“组建团队—选题—分工合作—项目验收”的过程进行,由学生自行组建团队,一般4~6人为一组,教师外部协调,注意好差生的平衡、男女生搭配等。开放型项目的题目应由教师精心挑选,或者由学生提供题目并经过教师审核,保证题目具有一定的科学性和可行性;选好题目后开始角色分工,每组确定一名组长充当项目经理,其他组员根据兴趣和特长分配相应角色。项目实施过程中,教师可借助分数甚至虚拟货币形式,激发所有组员的集体荣誉感,充分调动组员的最大潜能,以出色地完成各自的分工任务;最后是项目的验收,每组需提交实验报告、系统需求及设计说明书、软件系统,实验报告的内容至少包括实验目的、实验原理及思路、实验过程介绍、系统运行截图、实验结果分析、团队分工说明6方面。受课时限制,本阶段任务大部分在课下进行,预留2节课上时间组织“开放型项目答辩汇报会”。汇报会由教师主持,以组为单位依次进行答辩汇报,通过该环节促进各小组之间分享成果和心得体会,同时锻炼学生的口头表达能力和报告能力。

4)建立科学、多元的考核评价体系。

另外,教师还需结合CDIO评价标准,建立多样化的考核形式,对学生进行多方位的综合客观评价,采用过程式评价与结果式评价相结合的方式,既关注学习效果,又关注学习过程。新考评体系从学生的专业知识、个人自身能力、团队协作能力、系统工程4方面,通过平时作业、上课情况、实验及实践项目、期末笔试4种形式进行综合评价。

平时作业的考核占10%,具体考核内容为理论知识作业以及程序设计作业。理论知识作业要求清晰工整、独立完成,程序设计作业要求能得到正确运行结果、代码规范;上课情况的考核占10%,具体考核内容为出勤率、课堂表现和专题知识演讲,出勤方面要求没有无故缺课,课堂表现要求认真听课并积极发言、学习主动性高、对于专题知识演讲积极参与、准备充分、表述清楚;实验及实践项目的考核占50%,具体考核内容为验证型实验、综合性开发项目和开发型项目,验证型实验要求程序正确符合要求、实验报告文档规范,综合性开发项目要求过程规范、各阶段文档齐全且正确、程序正确符合要求,开发型项目要求成员职责分工明确、成员间沟通良好、有团队意识、集体荣誉感强、自主钻研克服难题、具备一定的工程思维、具有创新思想;期末笔试的考核占30%,主要考查C#基础知识,要求掌握基础的程序设计知识、会分析程序、在规定时间内编写程序。

3 结 语

东南大学成贤学院对2012级计算机系本科生的C#程序设计课程进行CDIO教学改革试点,用新的考评体系测评学生的学习成绩,与以往学生相比有以下提高:第一,学生的学习主动性明显提高,课堂气氛更为活跃,学生参与度高;第二,学生的程序设计能力增强,90%的学生能独立完成课程实验,还涌现出一批优秀学生参与各种程序设计大赛并取得优异成绩;第三,创新能力、团队意识有所提高,学生学有所思,能提出一些新想法,课余自组团队,积极申报创新项目,2012级学生创新项目立项数创历史新高。总体来说,新教学模式更有助于应用型人才的培养,与企业对软件开发人才的需求相适应。

参考文献:

[1] 中国教育报. 2011北京工程教育区域性国际会议召开[EB/OL]./paper.jyb.cn/zgjyb/html/2011-05/12/content_46334.htm.

[2] 王洪发, 于峰. 基于CDIO理念的WEB程序设计教学改革探索[C]//第三届教学管理与课程建设学术会议论文集. 株洲: 湖南工业大学出版社, 2012: 35-38.

[3] 姜大志, 孙浩军. 基于CDIO的主动式项目驱动学习方法研究: 以Java类课程教学改革为例[J]. 高等工程教育研究, 2012(4): 159-164.

[4] 曹莹莹, 朱立才, 蔡长安. 基于CDIO的程序设计类课程案例的设计与实施[J]. 计算机教育, 2011(6): 56-58.

[5] Worldwide CDIO Initiative Standards[EB/OL]./cdio.org/implementing- cdio-your-institution/standards.

第3篇

武强,边巴旺堆

(大学 工学院, 拉萨 850000)

摘要:在当今信息社会,信息检索已经成为人们日常工作的一部分。藏文作为一种古老的文字,也融入了当今的信息时代,越来越多的网页、电子邮件等电子文档以藏文形式出现。该文主要探讨了藏文的构成、编码、分词及藏文相关提示词的实现原理及方法,对具有重要影响的藏文分词和排序进行了深入的分析,实现了在信息检索系统中基于权重的藏文自动提示功能。通过测试分析,该功能能较好地分辨藏文和依据权重对藏文进行相关词提示。

关键词:藏文;分词;信息检索;相关词提示;编码;网页

中图分类号:H214 文献标识码:A 文章编号:1009-3044(2014)19-4378-03

Research and Implement of Tibetan Term Suggestion in Information Retrieval System

WU Qiang, BianBa Wangdui

(College of Engineering, Tibet University, Lhasa 850000, China)

Abstract: Information retrieval has become a part of people work in today’s information society. As one ancient language, Tibetan has blended in with today’s information age. There are more and more web pages, e-mails etc. in the form of Tibetan. The paper mainly discusses the structure, encoding, term segmentation of Tibetan and implementation mechanism and method of Tibetan term suggestion, and analyses deeply the Tibetan word segmentation and Tibetan sort, finally implements the function of Tibetan term suggestion based on the value of a Tibetan word in documents. From testing, the function can distinguish Tibetan word and get the Tibetan term suggestion based on value properly.

Key words: Tibetan; word segmentation; term suggestion; information retrieval; encoding; Web page

1 概述

目前,随着互联网和个人电脑的发展,信息量每天都以指数级增长,信息检索[1]成了一种人们获取日常信息的主要手段。藏文,作为一种古老的书写文字,其历史可以追溯到1400多年前。迄今为止,以藏文记载的古典著作浩如烟海,这些书籍在藏民族的传承和发展上发挥着重要的作用。随着信息时代的到来,以藏文形式记载的各种网页、文档也越来越多,利用检索系统对藏文进行检索,可以更快地获取信息,同时也促进了藏文的发展。

相关词的自动提示功能(Term Suggestion)在一些常用的网站上可以看到,比如搜索网站谷歌,百度,电子商务网站淘宝,易趣等。相关词的自动提示功能优化了搜索结果,通过系统来猜测检索人需要的搜索词语,为检索人在信息检索时提供了更多的便利和较准确的检索结果。图1显示了百度搜索引擎上相关词的提示功能。从该图我们可以看到,相关词的提示功能即提高了检索书写速度,又延长了检索词的长度,为进一步返回更准确的结果提供条件。

图1 百度上汉语自动提示功能

2 藏文的构成、编码及分词

2.1藏文的构成

藏文字是一种拼音文字,可以被看做由基本字符且基本字符通过纵向叠加和横向连接而成[2][3]。藏文字主要由现代藏文和一些梵音转写体和反写体组成。现代藏文是由三十个辅音字母和四个元音字母组成,它是藏文字的主要组成部分。加上梵音的转写体和反转体,藏文共有四十一个辅音字母和十三个元音字母。图2给出了一个藏文字的各组成构件,藏文字看起来虽然复杂,但每一个藏文字并不是随意构成的,它有一套严格的构字规则和文法体系,违犯了构字体系,该字就不能被视为藏文,既不能拼读,也不会有实际意义。

图2 藏文字的组成构件

2.2 藏文编码

由于藏文信息处理技术的起步较晚,在发展的前期还没有形成统一的编码,各个公司在开发藏文软件时都使用自己开发的编码系统[4],这必然导致各个藏文软件的不兼容,容易形成乱码。1997年,国际标准化组织通过了藏文国际编码标准,藏文有了一个统一的编码标准体系。信息检索系统在对检索词进行检索之前,首先要从互联网或本地磁盘系统抓取要被检索的网页或文档,然后对文档进行分析和建立索引,最后文档才被检索。在这个过程中,识别被检索的网页或文档的编码是一项非常重要的工作,只有识别正确,返回的检索结果才不会形成乱码。在本系统的开发测试期间,我们的网页和文档主要采用藏文的国际编码标准,即Unicode编码。当然,我们也可以对具有不同编码的藏文网页或文档进行统一编码,然后再进行文档的分析及索引,这个过程主要涉及到藏文的编码及转换[5],从文献[5]可以看出,通过合适的途径,我们可以把目前不同的藏文编码统一为国际编码。

2.3 藏文分词

藏文词语之间是用分隔符来划分的,类似英文中的空格,横向上又和中文有一定的相似,藏文分词是进行藏文信息处理的一项基本工作,文献[6]提出了基于格助词和接续特征的藏文自动分词方案,该方案参考藏文词语的特点和汉语在分词方面已经做出的一些成绩。在本系统的设计中,藏文分词主要考虑在以下几个方面:

1) 藏文检索词本身应具有实际意义

在信息检索系统中,用户想要得到的是满足需要的实际内容,所以输入的检索词也必具有实际意义,这样的检索词在语意和构成上应该符合藏文的相关规范。对这样的检索词进行分析、建立索引应该能满足检索系统的要求。

2) 藏文词典是实现相关词提示的一个很好参考模型

在信息检索系统中,词典是进行词句分析的一个参考模型。藏文词典本身就具有良好的藏文分词功能,且能帮助用户纠正检索词输入中的文法错误,结合藏文词典和检索词,可以更好地满足藏文分词需要。

3) 藏文词语的权重是实现相关词提示排序功能的重要指标

词语的权重是实现相关词提示的一项重要指标。在信息检索的过程中,大家都关心的词可以赋予更高的权重。在藏文相关词提示系统中,依据藏文词语的权重进行排序,权重高的排在前面,以此类推。

3 藏文自动提示功能的实现及测试

3.1 藏文相关词提示的实现

在藏文相关词提示的具体实现中,限于提示词的数目,相关词的提取和排序就变得非常重要。设计合理的相关词提取和排序可以使用户得到更好的体验。

1) 藏文词典排序算法

藏文词典排序算法按照现有藏文词典的排序方法,即所有藏文词语按照藏文基字的先后顺序分组排列,每组中各个词语按第一个音节为独体字、有后缀(后加字和再后加字)、有元音、有下加字、有上加字(逐步从简单到复杂)的顺序排列,对于具有元音的词语也与前者相同,即从基字加元音、有后缀、有下加字、有上加字的顺序排列[7][8]。排序的一种实现方法是:首先,把所有的藏文词语按照基本辅音字母分类成四十一个组,并保持国际编码标准中辅音字母的先后顺序;然后,在同一个组内,根据该字所具有的构件元素及构件元素之间的优先级来排列藏文词语;其次,每一个构件元素内部的所有字符要有序;最后,整体藏文的优先级最大者先排[9][10]。根据文献[7],藏文词条大约常用的是1.4万余条,那么,怎样从这1.4万余条词语中选取数量有限的相关提示词,选取的这些提示词是否与用户搜索的信息有关联,这是藏文相关提示词设计时要考虑的。考虑到从词典抽取出的一系列相关词本身和用户输入的检索词的相关度并不是很大,所以在本系统的设计中我们只用藏文词典来进行纠错和藏文分词。

2) 基于查询日志的藏语相关词的实现方法

用户通过信息检索系统输入检索词时,检索系统会自动记录用户的查询词和点击的相关文档,记录的文件称为查询日志[11]。通过查询日志,可以清楚地分析出用户使用频率最高的藏文查询词。通过信息检索中的聚类技术[1],对查询词进行聚类,这样就可以得到相关度较高的一系列藏文相关词了。当用户输入检索词时,系统根据用户输入的检索词的相关字母,选取其中以同样字母开头的一些权重较高的词组,利用权重的大小,进行排序,最后通过检索系统用户界面,以下拉列表的方式,返回给用户一组相关提示词。其实现框图如图3所示。

图3 藏文相关词提示的实现框图

3.2 测试结果

本系统使用了940篇藏文文档,为了说明测试结果,只选择了其中的五个藏文词语用于相关词提示,词语及权重如表1所示,本系统的搜索引擎采用开源Lucene系统。通过表 1可以看出,我们选取的藏文词语的第一个字母是一样的,也就是说,本系统的藏文聚类是按照藏文的实际书写顺序,而不是其具体实际语意。

表 1 藏文在不同文档中的权重

图4 显示了输入检索词后具体的实现界面,从该界面可以看出,系统会自动列举权重比较高的5个藏文相关词并根据权重进行排序,且这些相关词具有确切的语意。用户可以从中选取检索的关键词或继续检索以满足自己的需要。

图 4 信息检索系统中藏文相关词提示的实现界面

4 结束语

藏语作为一个民族语言,其信息处理技术起步较晚,但已经有了很大的发展。鉴于藏文文体的复杂性,藏文在信息检索方面的研究与国际上还存在着一定的差距,但随着网络的发展,更多的研究人员将投入到藏文信息化的领域上来,藏文在信息检索方面将会有更进一步的发展。该文相关研究成果获得自治区自然科学基金项目《实施电子政务平台网络信息安全及应急预案研究》资助。

参考文献:

[1] Christopher D.Manning,Prabhakar Raghavan,Hinrich Schutze.信息检索导论[M].王斌,译.北京:人民邮电出版社,2010.

[2] 江获,董颖红.藏文信息处理属性统计研究[J].中文信息学报,1995,9(2):37-44.

[3] 才智杰,才让卓玛.基于语料库的藏文字属性分析系统设计[J].计算机工程,2011,37(22):270-272.

[4] 刘汇丹,芮建武,吴健.藏文网页的编码识别与转换[C].中文信息处理前沿进展――中国中文信息学会二十五周年学术会议论文.北京:清华大学出版社,2006:573-580.

[5] http:///html/rfc2781

[6] 陈玉忠,李保利,俞士汶,等.基于格助词和接续特征的藏文自动分词方案[J].语言文字应用,2003,1:75-82.

[7] 东噶洛桑赤来.东噶藏学大辞典[M].北京:中国藏学出版社出版,2002.

[8] 格桑居冕,格桑央京.实用藏文文法教程[M].成都:四川民族出版社,2004.

[9] 边巴旺堆.基于ISO/IEC10646藏文编码字符集标准的藏文排序算法设计与实现[D].拉萨:大学,2009.