信息检索策略

  • 格式:ppt
  • 大小:234.00 KB
  • 文档页数:47

下载文档原格式

  / 47
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 表示工艺方法、加工技术的名词术语,如铸造、 锻造、热处理、焊接、酿造、取心钻进、爆破 成型、激光切割等; • 表示化学元素、化合物、金属材料与合金的 名词术语,如钠、氧原子、ⅣA族元素、钠化 合物、硅化物、硫酸、钛络合物、钉胺、呋喃、 吡啶、醇聚四氟乙烯、丁二酸(P)以及如金 属板耐蚀钢、耐蚀合金等; • 表示国家名称、地名、组织机构名称及人名 的专有名词以及文献类型、文献载体的名词术 语,
7
二 信息检索步骤
① ② ③ ④ ⑤ 分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息
8
1、分析检索课题 明确信息需求
• 检索需求类型 • 主题概念分析 主题概念分析(注:是课题检索的重点和难点) • 检索目的(申报课题、开题报告、学术论文、成果查 新、课程论文、商业需求以及其它需求类型等) • 文献类型(期刊论文、会议论文、科技报告、图书、 专利、标准、网站等) • 结果形式(全文、文摘、题录、数值、事实等) • 检索年限(如2000年以来的文献) • 语种(中文、外文;英文、日文) • 检索结果数量(100?50?)
19
2.选择检索工具 了解检索系统
• 与检索主题相关的检索工具有哪些?* (主要看数据库的学科覆盖范围) • 与检索需求的文献类型相关的检索工具 有哪些?(如:哪些数据库或网站中含 有会议论文) • 语种、年限、结果形式(全文还是文摘) (如检索1989~1994年的文献,选择维 普还是CNKI)


3
2、信息语言
分类语言 以学科和专业集中文献 适宜族性检索 主题语言 能将不同 不同学科的信息集 中到一起 适宜特性检索
不利于新兴学科、交叉学 不利于新兴学科检索 科和边缘学科的检索 查全率不高 查准率不高
4
• 3、信息检索技术 • 计算机信息检索技术是用户信息需求和 文献信息集合之间的匹配比较技术。 • 布尔逻辑检索 截词检索、邻近检索 布尔逻辑检索、截词检索 邻近检索、 短语检索、字段检索 网络信息检索 短语检索 字段检索、网络信息检索 • 几乎所有的检索系统都有布尔逻辑检索、 截词检索(模糊检索)和限制检索,而不同 的检索系统又会有一些特殊的检索技术 和功能。
32
追溯检索的更多应用
• • • • • • • 文章 参考文献 更多文章 文章 作者 文章 作者 文章 作者 团体 更多作者 文章 链接 网站 更多链接 期刊论文 图书 图书 期刊论文
33
追溯检索的作用
• 用较少的文献引出较多的文献 • 了解科学研究的前期工作基础、相关文 献、经典著作、主要作者、重点期刊等。
31
追溯检索法
• 也叫扩展法、追踪法。此法不是利用确定的检索工具, 而是利用已知文献的某种指引,如文献附的参考文献、 有关注释、辅助索引、附录等,追踪查找文献。 • 根据已知文献的指引,查找到一批相关文献;再根据 相关文献的有关指引,扩大并发现新的线索,去进一 步查找。如此反复追踪扩展下去,直到检索到切题的 文献。 • 用追溯法检索文献,最好利用与研究课题相关的专著 与综述,因为它们所附的参考资料既多且精。 • 在检索工具不全、文献线索很少的情况下,可采用此 法。
22
2.3 如何了解一个数据库
• 国际国内的在学术等领域的影响或地位 • 服务形式(WEB、光盘、联机检索、单机) 校内、国内、国外。镜像 • 涵盖学科或主题范围 • • • • • • • 文献类型(出版形式、内容层次) 收录年限,收录对象 数据量(记录数) 文种 更新频率 访问模式(口令,IP控制) 其它信息:帮助信息、出版者、发行者、在同行中的 地位。
38
文献的半衰期:某学科领域现时还在利用 文献的半衰期 的全部文献中的一半是在多长的时间内 发表的。例如:物理学文献的半率期是 4.6年,即是说:现时仍在利用的物理学 文献的50%,其出版年龄不超过4.6年。 • 半衰期与文献的增长、学科差异、学科 发展的阶段和信息环境与需求有关。
5
• 第二节 信息检索策略
6
一、什么是信息检索策略?
• 执行一个课题的检索是有过程、分步来 完成的,检索步骤的科学安排 检索步骤的科学安排称为检索 检索步骤的科学安排 策略(retrieval strategy),它是为实现检 索目标而制定的全盘计划或方案。特别 是在计算机检索中,策略问题是明确提 出来的,必须慎重考虑,因为它可能要 完成的是一个比较复杂、精细的检索课 题,又是在人与机器的对话、交互中实 现的。
9
查找某概念的确切含义 如:什么是“blog”
1.1 检索需求类型
特征型知识: 一般通过事实 型、数值型数 据库和搜索引 擎获得。
查找某概念的背景知识 如:谁最先发现青霉素 查找某些事物的数值及量化指标
10
查找某一学科的一般知识 如:关于分子生物学有哪些专著 查找学科专业领域的新进展 如:有关纳米技术的研究综述 查找课题相关的专业文献 最常见的!
关联型知识: 文献数据库
11
1.2 主题概念分析
从熟悉的已知文献信息入手 • 分析检索课题的内容实质 • 找出隐性的主题概念并将抽象的主题概念转化 为具体的概念 • 找出核心概念,排除无关概念和重复概念,简 化逻辑关系 • 明确概念间的逻辑关系
12
例如:
• 从镀锌残渣中回收锌工艺?
– 实际是:从高品位镀锌残渣中分离铁 – 所以课题可以这样表述: “从锌块中分离铁”
25
2.4 如何获得数据库的检索帮 助与指南信息
• 一般数据库界面上都有“帮助”或者 “检索指南”。 • 图书馆等文献机构发布数据库时提供的 使用帮助。 • 通过Google等搜索引擎搜索。 如:filetype:ppt 中国期刊全文数据库
26
3. 确定检索途经,选定检 索方法
• 有什么样的检索标识或检索语言,就有 什么样的检索途经(检索标识:题名、 主题或关键词、摘要、全文、作者、机 构、分类、出版物名等)
– 稻米、皮糠、提取、天然、食品、色素 – 稻米、色素
15
排除检索意义不大的词
• 排除检索意义不大而且比较泛指的概念
– 如:展望、发展趋势、现状、近况、生产工 艺、应用、利用、作用、方法、影响、制备、 结果
• 不要望词生义
16
明确概念间的逻辑关系
• 同义词、近义词是或的关系 • 上位词 即扩检,如“教育心理学” • 下位词 即缩检,如“智育心理”、“德 育心理”、“美育心理”、“教学心理 学”、“学习心理学”、“教师心理 学”、“学生心理学”等。
24
2.4 如何检索一个特定的数据库
• 宏观上了解数据库,熟悉界面。 • 利用数据库提供的检索指南(帮助、FAQ)。 • 了解检索与浏览模式(一般检索、高级检索、 分类检索、特色检索等;按主题浏览、按出版 物字顺浏览等)。 • 检索结果的获得(多种全文格式、题录信息保 存、提供预印本) • 其它特色功能(检索策略保存、信息定制) • 全文阅读工具(PDF、专用阅读器)
37
老化规律应用---限定年限 的检索方法
• 在进行文献信息检索时,注意文献出版年的限 出版年的限 定。学术信息的半衰期一般是3~5年。许多 信息的老化如艺术品、经济信息、市场信息等 表现出跳跃性。有时突然失效,有时永不失效。 • 查阅文献信息时尽量选取较新的文献。同时要 顾及较早的文献。一般性研究 一般性研究可选择近5年来 一般性研究 的文献即可。了解背景资料 了解背景资料的则要长得多。 了解背景资料 • 对发达国家的文献 发达国家的文献的利用可以在中文文献年限 发达国家的文献 的基础上增加3~10年。
27
回顾:信息检索方法
28
3.1 间接检索法(即检索方法)
• 间接检索法是借助于检索工具查获所需 文献的方法,包括顺查法、倒查法和抽 查法。 –顺查法 是经过分析,确定查找的起始年代, 再利用选定的检索工具由远及近地 逐年查找文献的方法。 •它适用普查一定时间的全部文献, 查全率较高,并能掌握课题的来龙 去脉,了解其研究历史、研究现状 和发展趋势。
– 若多个下位词都用来检索,相对于一个上位 词来说,一般是扩检。 – 一个下位词相对于一个上位词来说,一般是 17 缩检。
如何选词
• 表示具体事物名称的名词术语,如汽车、变压 器、反应堆、水稻、坐标仪等; • 表示事物的状态或现象的名词术语,如强度、 失真、土壤熟化、日冕、船舶过载等; • 表示科学分类的名词术语,如数学、物理学、 中医学、电子学、建筑工程、水利工程等; • 表示研究方法、技术方法的名词术语,如分析 (化学)、针刺手法、有限元法、结构功能法、 本页面内容参考《汉语主题词表》 本页面内容参考《汉语主题词表 力学性能试验等; 》 18
第三讲 信息检索策略与信息需求分析
1
第一节 信息检索基本知识 • 信息检索中需要了解的 几个基础知识 1、信息特点 、 2、信息语言 3、信息检索技术
2
• 1、信息特点 、
• 文献信息分类特点 方便文献信息的排架,便于索取; 类目的结构严谨,逻辑性强; 适合学术信息资源的组织。 网络信息分类特点 根据网络信息的存在状况和当前上网用户的特点来编制的, 科学性、系统性稍差; 适合大众信息资源的组织。 数据库信息分类特点 结合文献信息分类和网络信息分类的优点 方便浏览和检索
29
–倒查法 •此法与顺查法相反,是按照时间范 围,利用选定的检索工具由近及远 地逐年查找,直到查到所需文献为 止。 •由于这种方法重点是查检近期文献, 所以能获得较新的文献信息,节省 检索时间。 •然而不如顺查法查全率高,容易产 生漏检的现象。
30
抽查法
• 是根据检索需求,针对所属学科处于发 展兴旺时期的若干年进行文献查找。 • 用这种方法能获得一批具有代表性、反 映学科发展水平的文献,检索效果和效 率较高,但必须熟悉学科发展的特点。
20
2.1 选择检索工具的一般方法
• 根据不同的文献类型和语种需求选择 • 根据利用方便、使用熟练的程度选择 • 根据相应速度、获得支持和帮助的程度 选择 • 根据数据量、信息年限的需求选择 • 根据经验和推荐选择
21
2.2 选择的前提:知道有哪 些信息源
• 图书馆网站的书目、数字资源列表 • 搜索引擎 如:谷歌图书搜索、百度图书搜索、谷 歌学术搜索、谷歌专利搜索等 • 网络目录 http://dmoz.com/ • 提供公共信息的专门网站,如标准 • 开放获取信息资源,如ArXiv预印本文 献库
34
3.2 直接检索法
• 是指直接通过浏览、查阅文献原文而 获取所需文献信息的方法。这种方法 不依靠检索工具,所以不是严格意义 上的检索方法
35
• 优点:能够明确判断文献所包含的信息是否需要 –缺点:是难以获得全面的文献,且费时费力,具有 一定的盲目性和偶然性。 –如果检索课题单一,文献相对集中,又熟悉检索书 刊,可用这种检索方法。 –对于有多个主题、文献离散度较大的课题,则不宜 用此法 –由于直接检索具有准确性和实用性优势,能满足用 户直接获取文献的要求,因而是文献检索的必要手 段。
13
隐性主题具体化
如:酸洗费液的处理 处理 处理:“回收”、“再生” 如:煤灰利用 具体利用:? 检索式:
(粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+……)
14
Leabharlann Baidu
找出核心概念,简化逻辑 关系
• 并不是概念越多越好! • 抓住主题的核心:最能表达检索课题内 容,而且具有实际检索意义的关键词。 • 如“利用稻米皮糠提取天然食品色素”
23
如何了解一个数据库 样例:书生数字图书 书生数字图书
• 国内重要的数字图书之一 • 服务形式:WEB/镜像 • 涵盖学科或主题范围:所有学科 • 文献类型(出版形式、内容层次等): 电子图书,全文(一次文献) • 收录年限,收录对象: 2001~2003,纸本图书的数字化 • 数据量(记录数):11.4万 • 文种:中文 • 更新频率:年 • 访问模式:IP控制
36
3.3 文献信息老化规律的应用
随着时间的推移,信息的价值会逐渐衰减 乃至失效。文献信息表现出老化规律。文献信 息老化的情形有: 所含信息仍有用,但现在已经被包含在其它更 新的文献中。 所含信息仍有用,但现在正处于人们对其兴趣 下降的阶段。 所含信息仍有用,但为后来的文献所超越。 所含信息不再有用。