发新话题
打印

[转载]Wais介绍

[转载]Wais介绍

信息来源:邪恶八进制信息安全团队(www.eviloctal.com

Wais的促成动因

名字“Wais”(读作“Wayz”)代表“广域信息服务”(Wide Area InformationService)。Wais作为Internet一项服务, 是唯一由三个商 业公司(Apple、ThinkingMachines和Dow Jones )启动的研究计划促成 的服务。

Wais的最初设想是雄心勃勃的。该设想要求,在浩翰信息世界中,计算机能为你跟踪大量的数据,筛选这些数据,然后向你提供仅与你的要求有关的信息。该设想旨在编制出一个能起提供参考的图书管理员作用的程序,这个程序可节省你的时间,并可以访问到你也许迄今不知道的信息。

例如,假定你的报纸每天以电子方式递送,这些信息将在你的计算机屏幕上显示。假如你能告诉程序你想看什么内容,并让程序来选择和显示这些内容,这有多么理想!

再如,我想对计算机说:“每天我要求你向我显示体育新闻,不要显示商情。我想看用自动问答程序选择和显示的各种内容,但只限于看它是 否提及NewYork Mets, 除了在‘世界杯’赛事期间,我不想看任何足球方面的内容。噢,是的,我还想看世界新闻,但政治内容不要太多。是否有涉及飞机的内容,最好能保证有这方面的内容……”

你会这样想:让计算机程序来做这种事吧。此外,你还希望当这个程序找到一篇真正使你感兴趣的文章时,你可以告诉它不要再找相同主题的其它文章了。

当然,只要有了这样一个系统,你就不必陷于各种新闻的汪洋大海之中。任何一种能被计算机存取的数据,原则上,都能由具有判别力的计算机程序为你检索出来。

在此,可以看到Wais之所以成功的原因:Apple 公司制造了具有便于使用的图形接口的个人计算机;Thinking Machines公司制造了含有许多 处理器,适合于迅速检索大量数据的计算机;Dow Jones公司经营了信息 服务业。

显然,这样一个系统在有些方面是很奇妙的。你可以让计算机程序处理信息检索的一切细节。你只需要象贵客一样,什么也不用动手就能按你的要求阅读个人专用的报纸。

当然,事情总会有局限性。首先不论多么个人化,你的计算机屏幕上的一系列文章始终不能取代可平放在桌上、用眼逐页阅读的印刷型的报纸 或书籍。

其次,无论计算机程序怎样迎合你的好恶,你接收的任何数据,都只是针对你所提出的问题。你自己当然可以知道什么时候想看什么,却常常不能准确地提出该问的问题。

最后,该计算机程序只能找到计算机处理过的数据,这就是很大的局限性。试想一下,在一个正规图书馆中你能获取多少信息? 你可以步入图书馆,从书架上取下任意一本书,打开并阅读这本书。虽然有时准确找出你想要的内容很麻烦,但你可以翻阅书架上的每一本书,以及目录,在可能情况下,也可以请专门的图书管理员来查找。

人们常犯的一个错误是,以为能在计算机化的图书馆目录中检索图书,就能使用计算机阅读那本书的文本。在大多数情况下,即使你在计算机帮助下找到一本书,你仍然必须真正拿到这本书后才能阅读它。关键是,与实际的图书馆比较,将文本贮存在计算机中的图书和期刊 太少太少了。

Wais的最初计划是开发一个统一化的信息检索系统,这个系统能够访问全世界的全部数据库。有些数据可从Internet中免费获得,但在人们开
始有偿使用信息之后就不再这样了。

Wais的未来或多或少可以预见到,起码也能事后知晓。它不会是未来的信息工具。是的,有些人使用象Wais一样的付费计算机系统,但我们大多数人仍然依赖于老式的印刷件。

因此,就Internet而论,Thinking Machines公司已停止提供公开传 播的Wais 。Wais的免费版本叫做Freewais,现在由名为CNIDR (联网的信息显示和检索交换站)的机构维护。

不过,Wais对于Internet仍然是很重要的,其原因是:Wais已逐渐发展成为一个系统,该系统能提供极其重要的优质服务。

何为Wais

Wais是一项Internet服务,它能检索数百个数据库中的任意一个数据。每个数据库是一个资源。你告诉Wais使用哪一个资源,你想找什么, 你给Wais检索的内容指定一个或多个关键词,Wais将在你指定的资源中检索各条目的全部文本,找出满足你的标准内容。这个过程叫作全文本检索。

例如,你可让Wais对着一大批资料(recipes) 并告诉它找出所有含有单词“大蒜”、“鸡”、“水稻”的资料。或者可检索1992年美国总
统竞选活动中比尔·克林顿的讲演集,找出涉及“税收”、“削减”和“承诺”的讲话。或者可以检索蛋白质位置和模型的参考文献,选出所有含单词“二氢叶酸还原酶”的引文。或者可以检索《圣经》、《古兰经》、《摩门教徒的书》,找出所有包括单词“通奸”的章节。

使用Wais相当简单,你只需选择一个或多个资源,然后告诉Wais要找什么。Wais将与包含这些资源的计算机连接,并要求它们进行检索。输出将是文章或引文的清单。

Wais将向你显示这个清单,按相关程度从大到小显示条目。Wais认为有关的内容是以你指定的关键词在每篇文章中出现的频率为根据的。Wais认为最相关的文章是关键词出现次数最多的文章。

Wais向你显示它查找到的东西,你要通读这个清单,选出你想看的条目。然后Wais将检索实际文本,并将其显示在你的屏幕上。 如果你要保留这个条目,可以告诉Wais将其存到一个文件中,或将其邮寄给自己(亦可邮寄给其他人)。

当你找到一篇与你的兴趣特别相关的文章时,可以告诉Wais对这篇文章全文扫描或部分扫描,并使用这些词作进一步的检索,这叫做“关联性 反馈”。

Wais提供的服务可能是非常有用的,但仍有局限性。首先,Wais 只能在查找了你所需信息后才对你有所帮助。虽然几百个信息源听起来好像很
多,但它们并不能覆盖人们可能提出的全部问题。

其次,Wais实际上检索资源中所含的每一个词,而不考虑小的常用词, 如“a”和“the”。但这仅仅是一种简单的、非上下文联系的检索方法。 例如,你可能告诉Wais检索含单词“税收”、 “削减”和“承诺”的讲演集,而这些词可能出现在文本的任何地方,例如,发表讲演的人可能说:“我们必须付出才智,以增强我们履行未来诺言的能力。”( 此句含有关键词“tax”,“ cut”和“ promise”——译注),此时我们无法叫Wais去查找“减税承诺”的有关内容。

当Wais正常工作时,它仍然是一种功能卓越的工具,它能为你节约大量的检索时间。因此,看一看Wais是如何工作的,我们应如何使用Wais。 Wais客户机同许多Internet服务一样,Wais使用客户机/服务器系统。你直接与Wais客户机上的程序相互配合。这个程序显示信息并执行你的命令。每一个Wais信息源由“Wais服务器”维护。Internet上有许多公共Wais服务器,你只需且只能通过Wais客户机来访问。

你无论何时提出请求,你的Wais客户机都会连接到适当的Wais服务器并要求它进行检索。服务器进行检索,将结果反馈给客户机,并在你的屏幕上显示出来。当你想看一个专门的条目时,客户机又向服务器发送请求,该服务器送回这个条目,你的客户机将一次全屏地显示出来。

有多种Wais客户机可通过匿名FTP免费使用。 你的系统可能已经有了Wais客户机程序。如果是这样,你只需要启动这个程序即可。两种最普通的Wais客户机程序是标准Unix系统的swais和waissearch,及x window 系 统的xwais。 还有大量其他系统的 Wais客户机。

如果你的计算机中没有Wais客户机,你可以telnet到表16-1所列的某个主机上。每一台这种计算机都提供任何人都能使用的公共的Wais客户机。你登录之后,客户机将自行启动, 不要口令。公共Wais主机提供的资源组并不相同。你可以要求试连不同的主机, 看哪个最适合。

当你telnet到公共Wais客户机时,你要使用swais客户机(表示“简单的Wais”)。在本章的其余部分中,我们将假定这是你正在使用的客户
机,如果你正在使用不同的客户机,你得阅读相应的资料, 但是, 使用Wais的基本思想与我们所讨论的相同。

有关 Wais 的其它信息, 有两个 Usenet 讨论组可以订阅: comp.infosystems.wais和alt.wais。还有一种Wais常见问题(FAQ)表,你将发
现它很有用处, 特别是你正在为你的计算机找Wais客户机时。



地区             Internet地址       IP地址       以…登录
芬兰             info.funet.fi      128.214.6.102  wais
美国:加利福尼亚州   swais.cwis.uci.edu  128.200.15.2   swais
美国:马萨诸塞州    nnsc.nsf.net       128.89.1.178  wais
美国:马萨诸塞州    quake.think.com     192.31.181.1  wais
美国:北卡罗来纳州   kudzu.cnidr.org     128.109.130.57 wais
美国:北卡罗来纳州   sunsite.unc.edu     152.2.22.81   swais
   表16-1你可Telnet到的公共Wais客户机



FAQ表定期邮寄到comp.infosystems.edu.wais,还可以通过匿名FTP从rtfm.mit.edu下传。请进入/pub/usenet/news.answers/wais-faq目录
查找名为getting-started的文件。

对Wais的思考

在下面各节,将向你介绍如何使用公共的Wais客户机进行检索。在介绍之前,我们提几条建议:

要熟练使用Wais可能有一个过程。检索结果极大地取决于检索所选的资源,及如何组配关键词。此外,Wais接口功能差(funky), 有一些习惯
的用法(对于没有生活在南加利福尼亚的你来说,funky 的意思是“质量低劣但仍奇妙(but still cool)”)。

你必须明白,Wais要像一个优秀的图书管理员那样最终知道如何去找到一本所要的书,是会有一个过程的。假如在初始阶段,你发现它很难提供有用的东西,请不要灰心, 只要你有了经验后, 就很容易有效地使用 Wais了。

有时,你可能发现,你得亲自进行简短的演示, 以使持怀疑态度的人确信花在Internet上的时间都是合算的。例如,可能叫你向上司或隔壁
办公室的同事演示Internet(在近六个月来,你尝试引起他们的注意)或向好友演示(他们认为使用计算机通常是浪费时间)。

如果你决定使用Wais演示,到那天客户机程序运行很慢,且不配合,你检索的每个资源都临时不工作。你不能向他们表示Wais如何很好地找出数据,你将满面羞愧,演示可能以无结果而告终。我们建议你向他们演示Gopher,Gopher比Wais可靠得多,并更容易使用。


开始使用Wais

要启动Wais,可以telnet到一个公共客户机,例如:telnet quake think.com在进行Telnet连接时,你将看到以下信息:
Trying 192.31.181.1……
Connected to quake:think.com:
Escape character is '^]'.
SunOS UNIX(quake)
login:
以Wais登录(你将不需要口令),然后你将看见:
Last login:Sat Jul 10 15:32:36 from jazz.ucc.uno.edu
SunOS Release 4.1.1(QUAKE)#3:Tue Jul 7 11:09:01 PDT 1992
Welcome to swais
Please type user identifer (optional.i.e user@host):
在此处录入你的Internet邮政地址,并按回车键。远程主机现在问你使用的终端型号:
TERM=(vt100)
你既可录入终端型号,也可按回车键,默认vt-100。回答了这个提问后,等待swais客户机运行,届时, 将看见一个资源清单,现在准备开始工作。



SWAISSource SelectionSources:463
#ServerSource
Cost
001:[archie.au]aarnet-resource-guideFree
002:[munin.ub2.1u.se]academic-email-confFree
003:[wraith.cs.uow.edu.au]acronymsFree
004:[archive.orst.edu]aeronauticsFree
005:[ftp.cs.colorado.edu]aftp-cs-colorado-edu Free
006:[nostr.omo.oes.orst.ed]agricultural-market-news Free
007:[archive.orst.edu]alt.drugs Free
008:[wais.oit.unc.edu]alt.gopher Free
009:[sun-wais.oit.unc.edu]alt.sys.sun Free
010:[wais.oit.unc.edu]alt.wais Free
011:[alfred.ccs.carleton.]amiga-slip Free
012:[munin.ub2.lu.se]amiga-fish-contents Free
013:[coombs.anu.edu.au]ANU-Aboriginal-Studies$0.00/minute
014:[coombs.anu.edu.au]ANU-Asian-Computing$0.00/minute
015:[commbs.anu.edu.au]ANU-Asian-Religions$0.00/minute
016:[  150.203.76.2]ANU-CAUT-Academics$0.00/minute
017:[coombs.anu.edu.au]ANU-CAUT-Projects$0.00/minute
018:[coombs.anu.edu.au]ANU-Coombspapers-Index$0.00/minute
Keywords:
<space> selects,w for keywords,arrows move. searches, q quits,or?




请看屏幕的各个部分,首先,最上面一行告诉我们:这是Wais资源选择屏(请记住,我们必须选择自己的资源才能开始检索)。在右上方可看见这个客户机程序,知道有463 个不同资源。

往下,看见前18个资源的简介。每一行表示含这个资源的主机地址,资源的名称和进行检索的价格。请注意,第一个资源是由亮光条显示的。当你使用这个清单时,你将在资源间选择,亮光条也移动,以指示当前资 源。

不必担心价格。所有的资源都是免费的。你不会因偶然的情况而付费。倒数第二行,可看见“Keywords”。当我们准备开始检索时,在这里
录入所选关键词。

最后,最末一行总结了基本swais命令。一旦你了解了如何使用swais,这些命令将更有意义。

在下面几节,我们将向你介绍如何选择资源和如何进行检索。在介绍之前,我们想先向你介绍两个最基本的swais命令。

第一,可以按“h”(帮助)或“?”键来显示命令摘要。swais 客户 机按“cbreakmode”(字符结束)的方式工作。 这表示你在使用单个字母 命令时,不必按回车键。例如当你想要帮助时,只需按“h” 键,不用按回车键。

第二,要停止swais并断开远程主机,请按“q”键。

使用q键时要当心,很容易在无意之中按q键——假如你正在阅读资源目录时——会使你与Wais的对话不可改变地中止了。

选择资源

使用Wais的一个方法是选择一个或多个资源,然后进行检索。在这节中,我们将复习用来选择资源的命令。在下一节中,我们将向你显示如何进行检索。然后举个例子,说明它是如何工作的。

选择一个资源,你要移动亮光条指向它,再按SPACE。Wais 将向你显示标有“*”符号的资源被选择。例如,在下面的清单中,资源10被选择:


008:[wais.oit.unc.edu]alt.gopherFree
009: [sun-wais.oit.unc.edu]alt.sys.sunFree
010:* [ wais.oit.unc.edu]alt.waisFree
011: [alfred.ccs.carleton.]amiga-slipFree


开始检索前,你可以按你想的那样选择许多资源。并且任何时候你都可以移动亮光条到一个新的资料并用SPACE键来选中。 如果你决定停止使用已选择了的资源,可以再一次移到它,并按SPACE键, 这样就可以不选该资源。想放弃所选的所有的资源并开始新的检索,按“=”(等号)键。

你在开始进行一个新的检索之前,需按“=”键清除前一个检索已经选择了的所有资源。

从一行移到另一行有几种方法。最容易的方法是使UP和DOWN键(带箭头的光标控制键)。如果这些键在你的终端上不起作用,或者,如果你不愿意使用这些键,那么,你还可以使用“j”或CTRL-N向下移动到下一行,使用“k”或CTRL-N向上移动到上(前)一行。 (虽然移动键的这种选择看起来很不规范,但他们与使用的vi编辑程序却是类似的,并且许多Unix用户都使用这种类型的移动键。)

想全(整)屏向下移动到下面的资源,你可以使用“J”或CRTL-D ,想向上移动到前(上)一屏资源,你可以使用“K”或CTRL-U (注:这些字母都是大写的“J”和“K”字母)。想直接跳到某一资源,仅简单的录入其数字即可。 例如,想跳到15号资源,仅录入:

15 (在015中你不必录入第一个0字)

如果你已知道资源的名字,你就可以通过录入一个/(斜杠)后面跟着它的名字的前面几个字母,就可以跳到你所要选择的资源。 例如, 想跳到名为amiga-fish-contents的资源,录入:

/amiga-f

如果你想看Wais(能查到的)的一种资源技术信息,将亮光条移向它,并按v(view)键。例如, 如果你移到amiga-fish-contents资源,并按v键,
你就会看到下面的显示:


   Name:amiga-fish-contents.src
   Directory:/sources/
   Maintainer:hakan@hera.dit.1th.se
   Selected:No
   Cost:Free
   Server:munin.ub2.1u.se
   Service:210
   Database:amiga-fish-contents
   Description:
   Server  created  with  WAIS  release  8  b5  on  Aug  29  16:
24:34  1992  by anders@munin
   This is an index of the contents of Fred Fish&#39;s  disks  #1-
current  with
   a freely distributable AMIGA software library    containing
an extensive
   collection of PD.shareware and  demo programs.
   Search for ‘dieknr’ to see the  current  ( latest)   disk
number.
   Search for ‘ftp’ to see the some ftp sites where you  can
get the disks.



进行检索

当你已经选择了一个或多个资源,并准备进行检索,就按RETURN键。这时光标移到靠近屏幕底的那一行:

Keywords:

这时你可以输入任何关键词。当你输入时,有几种供你修改的方法。想删除单个字符按BACKSPACE键,如果这个键不能进行删除, 还可以试着按CTRL-H,DELETE,或者CTRL-BACKSPACE。只要我们使用的是以上的键,总有一个是可以进行删除的。

想删除整个词,按CTRL-W键;删除整行,按CTRL-U键。

下面是在我们录入几个关键词后,这一行象什么的例子: Keywords:tax cutpromise.

当你指定了你的关键词时,按RETURN键就开始检索。在该过程中 Wais将检索你指定的每一个资源,显示与之有关的清单,并将组织这个清单,使得最符合要求的排在第一位。下面是一个通过检索适合于上述关键词的名为clinton-speeches资源的例子。


   SWAISSearch ResultsItems:40
   #ScoreSourceTitleLines
001:  [1000](clinton-speeche) VP DEBATE ANALYSIS: Encyclopedi697
002: [928](clinton-speeche) THE ECONOMY: Staement791
003: [928](clinton-speeche) THE ECONOMY:Speech-Detroit 559
004: [819](clinton-speeche) LABOR: Speech-Washington,DC525
005: [782](clinton-speeche) ECONOMIC STRATEGY:6/21/92877
006: [728](clinton-speeche) ECONOMIC PLAN:Position Paper-773
007: [691](clinton-speeche) EDUCATION:Speech-Rockville 658
008: [673](clinton-speeche) VARIOUS TOPICS:Interview-Atl 830
009: [655](clinton-speeche) ECONOMICS:"New Covenant" Speech 634
010: [637](clinton-speeche) SMALL BUSINESS PLAN:Position P 598
011: [601](clinton-speeche) MANUFACTURING:Speech-Washing 706
012: [600](clinton-speeche) ON RESPONSIBILITY (BUSH&#39;S): Spe 237
013: [600](clinton-speeche) THE ECONOMY:Speech-New Orlea 227
014: [564](clinton-speeche) HEALTH CARE: Speech-Macon,GA 440
015: [546](clinton-speeche) LABOR: Speech-San Diego,CA 507
016: [509](clinton-speeche) ECONOMICS: Speech-Flint,MI- 283
017: [509](clinton-speeche) JOB RETRAINING: Speech-Dayton 359
018: [509](clinton-speeche) EDUCATION: Speech-Los Angeles 638
<space> selects. arrows move. w for keywords. s.for sources.  ? for help


现在你已看到了Wais所找到的东西。是否去查找这些由你自己决定。请注意第2列的得分,这个得分将告诉你条目与你的关键词相搭配的程度。最好的搭配条目总是获得1000分,其它所有的条目都有得分并按匹配的程 度排列。

1000分并不意味着是满足你需要的最好条目——而是指根据Wais的标准——这个特殊的条目具有最好的关键词搭配。此外,你还必须检查搭配结果。在大多数情况下,你总是想指定较好的关键词并想再试一次。

在这方面,有两种选择,你可以查看一些条目,或者可以试着进行另一次检索。想查看,就移到条目,并按RETURN,此时Wais将连接到合适的服务器上,并请求拷贝实际文件。当获得文件时,Wais将使用翻页程序显示文件,此时为全屏显示。

当你阅读文件时,你的屏幕是通过翻页程序控制的。有两个可使用的基本命令:想看下一屏,按SPACE键;想停止显示的文章,按q键(quit键)。当你在阅读时,按q键是退出翻页程序。除此之外的其他所有时候, 按q键都将是退出Wais。因此,你必须习惯这一点。

如果你想获得你刚刚阅读到的一个永久性拷贝,可以使用S (大写字母“S”)命令,将该文本贮存到一个文件中,或者使用m命令发送文本。使用S命令的条件是你在自己的计算机上使用的一个Wais 客户机(你不能在公共的Wais主机上存文件),不管怎样你总是可以使用m 命令给你自己或别人发送文本拷贝。

如果你对检索结果不满意,你还可以通过按w(keyword)键再试检索一次,这样也就可以恢复关键词行,你通过改变关键词就可以开始一次新的 检索。

当你决定在这个特定资源组中检索时,按s键, 这样就可以恢复资源屏,此时你可以选择或不选你想要的任何一种资源。记住:如果你决定开始用一个新的资源进行新的检索时,你可以按= 键停止选择所有的资源。直到你进行完一个新的检索,你才可以通过按r键, 重新显示前一个检索的结果。

在这方面,我们想就关联反馈说几句:对有的客户机,你可选择条目的全部或部分作为欲查找内容的代表,让Wais将此条目所有词语存起来,以帮助进一步的查找。这被称做关联反馈。当你telnet到公共Wais客户机上时,关联反馈就没有多大的考虑必要,然而,如果在你自己的计算机上使用的是一个高级Wais客户机, 你就可以使用关联反馈帮助你建立非常能够体现专指性的检索。

TOP

发新话题