Go Back   AppleForum > Lounge > Mac Column

 
 
thread_tools
2002-10-03, 05:40 AM   #1
casaubon
Moderator
 
casaubon's Avatar
 
Registered: Sep 2001
My Mac: MacBook Air
Posts: 2,140
온라인
모질라, 익스플로러에 도전하다

http://www.salon.com/tech/feature/20...ars/index.html

Mozilla rising
Netscape won't dislodge Internet Explorer from its hegemony over browser space. But its open-source sibling is aiming at even bigger game: Windows.

- - - - - - - - - - - -
By Farhad Manjoo

Sept. 10, 2002 8월 28일 온라인에서 사용하는 소프트웨어 통계를 조사하는 회사인 WebSideStory는 대부분의 네티즌이 이미 알고 있는 사실을 발표했다. 넷스케이프 네비게이터 웹 브라우저를 사용하는 인구가 거의 없다는 것이다. 인터넷 혁명을 주도했던 넷스케이프는 이제 3.4%의 점유율만을 갖는 비참한 신세로 전락해버렸다.

사실 작년만 해도 이정도는 아니었다. 90년대 중반에 거의 누구나 다 쓰던 넷스케이프의 점유율은 작년에 13%였기 때문이다. 하지만 이제 96%의 사용자들이 마이크로소프트 인터넷 익스플로러를 사용하고 있으며 조사에 따르면 넷스케이프의 점유율은 더욱더 떨어질 것으로 보인다. 웹사이드스토리 중역의 말을 빌면 브라우저 전쟁은 전쟁이 아니라 단순한 학살일 뿐이었다.

넷스케이프는 이 수치를 믿지 않는다. 넷스케이프 대표는 다른 조사 결과를 들며 넷스케이프의 점유율이 두 자리 대를 유지하고 있다고 주장하였다. 넷스케이프는 새버전인 네비게이터 7.0의 새로운 기능으로 사람들이 마이크로소프트에서 넷스케이프로 스위치하기를 기대하고 있다.

네비게이터 7.0은 좋은 브라우저이다. 안정적이며 인터넷 익스플로러만큼 신뢰성있고 페이지를 빠르게 렌더링한다.

하지만 네비게이터의 더 빠른 HTML 렌더링이나 "텝 브라우징"과 같은 새 기능들은 넷스케이프가 기반하는 오픈소스 브라우저, 모질라에 이미 존재해왔다. 넷스케이프 개발 모델을 보면, 모질라용 코드를 프로그래머들이 개발한 다음에 모질라의 "안정적인 버전"을 내놓은 이후에야 네비게이터를 다시 만들기 시작하는 방식이다. 이런 개발 시스템에 장점만 있는 것은 아니다. 넷스케이프가 언제나 모질라를 뒤따라갈 수 밖에 없기 때문이다.

확실한 점은, 넷스케이프가 저물어간다는 사실이다. 인터넷 익스플로러를 바꿔야할 이유가 있다면 차라리 모질라로 바꾸는 편이 더 설득력있다. 모질라는 넷스케이프가 제공하는 모든 기능들을 넷스케이프가 나오기 전에 미리 가지면서, 넷스케이프의 단점인 AOL Time Warner 광고를 피하기도 한다. 실제로 처음에는 실패로 평가받거나 무시당하기 일쑤였던 모질라가 서서히 흥미로운 최신 브라우저로 부상하고 있다. 모질라 개발자들은 브라우저 내의 블로거나, 파일 매니저, 챗 클라이언트, 구글 툴바같은 모든 종류의 번외 프로젝트를 실험하고 있으며, 대부분은 호평을 받고 있다.

이런 기능들이 인터넷 익스플로러라고 없는 바는 아니지만 모질라는 거의 무한대로 업그레이드가 가능하며 누구나 여기에 참여할 수도 있다. 개발자들에 따르면 인터넷 익스플로러를 크게 앞지를 기능도 모질라에서 보게 되리라고 한다.

또한 모질라의 장점 중에 하나는 모질라가 브라우저 이상이라는 데에 있다. 수많은 개발자들이 모질라를 하나의 "플랫폼"으로 사용하고 있으며, 모질라 코드로 달력이나 이메일 프로그램, 심지어는 리눅스 데스크탑에 이르기까지 비-브라우저 애플리케이션을 만들고 있다. 이런 애플리케이션을 사용하기 위해 모질라를 다운로드받을 필요는 없으며, 모질라 엔진의 최소 버전으로 배포되기도 한다. 어떻게보면 이런 방식은 마이크로소프트가 넷스케이프에 대항하는 전쟁을 일으켰을 때 막으려고 애썼던 것과 일치한다. 마이크로소프트는 하나의 플랫폼이 되어가는 넷스케이프를 저지하려 했다. 결국 마이크로소프트가 넷스케이프를 죽이는 데에는 성공하였지만 과연 플랫폼화를 향한 노력도 죽일 수 있을까? 넷스케이프가 죽은 다음, 레드몬드를 향해 불을 내뿜는 용으로서 탈바꿈할 것인가?

소프트웨어로서, 웹브라우저는 9년동안 정체 분위기였다. 첫 번째로 떴던 브라우저인, 모자이크(National Center for Supercomputing Applications가 개발했다)에는 이미 브라우저로서 필요한 부분을 모두 갖추고 있었다(뒤로, 앞으로, 홈, 다시읽음 등의 버튼과 주소록 등). 넷스케이프의 첫 번째 브라우저인 넷스케이프 모자이크 0.9는 이미 1994년에 모든 기능을 탑재했었다(정지, 책갈피, 다중 연결, 다운로드 속도 향상 등).

그리고 여기서 웹브라우저의 혁신은 멈췄다는 것이 웹 디자인에 대한 몇 가지 저서를 내놓은 전문가, 제이콥 닐슨(Jakob Nielson)의 의견이다.

"모자이크가 정점을 이뤘고 그 이후로 웹브라우저의 스타일은 한결같았습니다."

그는 웹브라우저가 현재 더 안정적이고 몇 가지 자잘한 기능이 덧붙여졌을 뿐이라고 결론내렸다. 주소창에는 더이상 http://를 칠 필요가 없는 것과 같은 기능이다(초기 웹브라우저에는 반드시 쳐줘야했다).

"하지만 웹 페이지의 출력이 아직도 잘 안되고 있어요. 전자 상거래 사이트에서 영수증 출력을 한 번 해보십시오. 두 번 중 한 번은 가격이 잘려나가기 일쑤입니다. 더 높은 해상도로 출력한다는 메시지 하나 브라우저가 말하지 못하는 형편이에요. 그래야 해상도에 맞게 이미지를 조절할 수 있잖겠습니까?"

닐슨이 원하는 브라우저는 핵심 프로세스로 "네트웍을 사용"하는 브라우저이다. 즉, URL 주소를 틀리게 적었더라도 사용자가 원할법한 주소로 자동적으로 고쳐서 보내는(구글의 검색 방법이기도 하다) 식이다. 이전에 갔었던 모든 페이지를 검색한 다음에 과거에 봤던 사이트로 선택 가짓수를 줄일 수도 있을 테지만 그 대신 모든 브라우저를 대신에 "디지탈 조절판(digital control panel)"로 이메일과 다른 네트웍 애플리케이션을 통합한 다음에 웹에 변화가 있다거나, 즐겨찾는 서버가 있는 경우, 혹은 온라인에 누군가 들어오면 바로 업데이트해주는 아이디어도 있다.

닐슨의 아이디어를 따라야하는 건 아니며, 여러분 각자가 원하는 브라우저가 따로 있을 테지만, 마이크로소프트로부터 그런 브라우저가 나올 것 같지는 않다. 그런데 현재 그러한 바램을 실현시켜가는 브라우저가 있다.

그동안 마이크로소프트가 브라우저 시장을 거머쥐면서 경쟁이 사라졌기 때문에 브라우저 자체의 질이 악화됐다는 의견이 있어왔고 그 의견은 입증이 됐다고들 한다. 당연히 마이크로소프트는 그런 의견을 거부하지만, 인터넷 익스플로러는 변화하지 않고 있다. 마이크로소프트는 인터넷 익스플로러 6.0의 세 가지 새기능으로서 미디아 툴바와 "content advisor", "automatic image resizing"기능을 예로 들고 있다.

마이크로소프트로서는 인터넷 익스플로러를 변화시켜야할 이유가 없으며, 돈을 벌어다주는 것도 아니다. 익스플로러 자체가 이미 너무나 광범위하게 퍼졌기 때문이다. 넷스케이프도, 모질라도, 노르웨이에서 나온 오페라도 마이크로소프트의 위치를 뒤흔들진 못하기 때문에, 마이크로소프트로서 익스플로러에 더 많은 자원을 들이는 건 어리석은 처사이다. 닐슨의 말이다.

"비극입니다. 뭔가 바꿀 동기가 없어요. '이대로'를 외치는 회사가 있다면 그 회사야말로 마이크로소프트입니다."

대부분의 웹 사용자들도 당연히 이런 걸 원하지는 않았지만 예전에 넷스케이프도 그랬던 적이 있었다. 닐슨의 말이다.

"넷스케이프가 실수한 겁니다. 브라우저를 주도적으로 이끌 수도 있었는데 이제는 무자비한 제국 앞에 홀로 선 꼴이 되버렸죠. 마이크로소프트가 약간이나마 더 우월한 브라우저를 내놓을 때도 있었어요. 넷스케이프 3은 인터넷 익스플로러 3보다 우월했지만, 인터넷 익스플로러 4는 넷스케이프 4보다 더 나았고, 인터넷 익스플로러 5는 훨씬 더 좋았습니다."

Megnut.com을 운영하는 블로거이자 웹 개발자이기도 한 멕 아우리언(Meg Hourihan)도 비슷한 얘기를 들려주었다.

"넷스케이프 3일 때 전 넷스케이프 사용자였습니다만 인터넷 익스플로러 4가 나오면서 저는 물론 모두들 마이크로소프트 쪽으로 옮겨가기 시작했습니다. 그때부터 넷스케이프는 절대 그자리를 되찾지 못했죠."

마이크로소프트의 브라우저 독점이 관계가 있는 건 사실이며 적어도, 연방 법원도 그렇게 생각하고 있으며 넷스케이프도 물론 마이크로소프트를 계속 성토하고 있다. 넷스케이프에서 클라이언트 소프트웨어를 관장하고 있는 로라 에시즈(Laura Yecies)는 지난 해에 잃은 시장 점유율이 모두 "마이크로소프트의 반경쟁 행위" 때문이라고 말했다. 하지만 그녀에 따르면 이런 반경쟁 행위에도 불구하고 새로운 넷스케이프가 사용자들을 스위치시킬 수 있으리라고 전망하였다.

하지만 넷스케이프 리뷰는 그리 호의적이진 못하다. CNET은 네비게이터가 AOL 광고를 계속 비추는 데에 실망하였고 모질라 최고의 기능 중에 하나인 팝업 광고 막이 기능이 없다는 것에 대해 비난하였다. CNET 리뷰 팀원의 말이다.

"넷스케이프 7에 거는 기대가 상당했는데, 팝업 광고 막는 게 없음을 알고 완전히 실망했습니다. 모질라나 인터넷 익스플로러에서 특별히 넷스케이프로 바꿔야할 이유가 없어요."

슬래시돗(Slashdot.com)에서 한 사용자는 모질라 대신 왜 넷스케이프를 사용해야하는 지에 대해 빈정거렸다.

"왜 모질라 대신 넷스케이프를 사용해야할까? 살아가는 데에는 팝-업 윈도우가 많이 필요한 것일까? 좀더 가까운 솔루션이 필요하기 때문일까?" ("Score: 5, Funny.")

좋은 질문이다. 거의 대부분의 영역에서 모질라가 네비게이터보다 더 좋은 브라우저이다. 예를 들어서, 넷스케이프의 새로운 기능인, 탭 브라우징 -- 하나의 브라우저 윈도우에서 여러 개의 웹을 열수 있으며 모두를 하나의 이름으로 북마크할 수 있다. -- 은 벌써 모질라에 몇 달 전부터 나와 있었으며, 훨씬 향상된 버전으로 모질라 프로젝트(멀티질라라고 불린다)도 존재한다. 넷스케이프의 예시즈의 답변이다.

"맞습니다만 모질라를 작성하는 엔지니어들은 넷스케이프 고용원들입니다. 넷스케이프를 위한 일반적인 브라우저의 사용성을 높이기 위함이죠."

똑같은 코드에 기반하고 있기 때문에, 넷스케이프 네비게이터는 모질라의 부가 기능도 쉽게 이용할 수 있다. 브라질의 웹 개발자인 파브리치오 좌르디(Fabricio Zuardi)는 웹 페이지의 배너 광고를 자동적으로 숨기는 플러그-인을 개발하였다. 프로그래밍에 초보자였던 그는 웹 튜토리얼에 있던 XUL -- "줄"이라고 읽는, 모질라의 주요 프로그래밍 언어이다. -- 을 이용하여 플러그 인을 만들었고 이제는 전세계의 개발자들이 그에게 코드 변화와 부가 기능들을 보내오고 있다.

브라우저에 블로깅 패널을 붙인 모즈블록(MozBlog)을 줄로 만든 호주에 사는 21세의 청년, 마이크 리(Mike Lee)에게도 똑같은 일이 일어났다. 웹 어디에서도 블로깅을 할 수 있도록 한 이런 기능을 다른 브라우저에서 하기는 훨씬 어렵다. 온라인 챗 상에서 한 리의 말이다. 모즈블록은 그의 첫 번째 개발작품이었다.

"모질라는 애플리케이션을 쉽게 확장시킬 수 있는 기술을 갖고 있어요. 프로그래밍이 유연한 브라우저입니다."

오픈-소스 개발자이며 모즈뎁(MozDev)의 창립자인 데이빗 보즈웰(David Boswell)은 수많은 개발자들이 모질라 프로그래밍에 뛰어들었다고 말했다. 그는 이 주제에 대해 "Creating Applications With Mozilla"라는 책을 공동으로 썼다. 그는, 모질라가 HTML을 읽어들이는 "렌더링 엔진" 게코(Gecko)가 대부분의 작업을 하기 때문에 프로그래머들은 코딩을 거의 하지 않고서도 웹 페이지를 만드는 것처럼 프로그래밍을 할 수 있다고 말했다.

"모질라는 이제 단순한 오픈-소스 브라우저가 아닙니다. 모질라 자체가 모든 웹을 넘나드는 크로스-플랫폼 프레임웍이에요."

보즈웰이 특히 좋아하는 프로젝트는 리눅스 시스템용 그래픽 인터페이스인 OEone Software의 HomeBase Desktop이다. OEone의 소프트웨어 개발자인 마이크 포터(Mike Potter)에 따르면, 홈베이스는 어떠한 데스크탑보다도 사용하기 쉽다. 메뉴 바도 없고 떠다니는 윈도우도 없기 때문에 다른 그래픽 기반 시스템보다 기능이 덜할지는 모르지만, 컴퓨터 사용을 막 배우는 초보 사용자들에게는 완벽하다고 한다. 포터 말을 그대로 인용하자면, 홈베이스는 "할머니를 위한 리눅스"이다. (현재 홈베이스는 리눅스에서만 돌아가지만 포팅이 쉬운 모질라 코드를 이용하며, OEone 자신이 소스 코드를 웹 사이트 상에서 제공하기 때문에 윈도우즈나 맥용으로 마음만 먹으면 무료로 만들 수 있다.)

모질라 개발이 실제로 마이크로소프트에게 위협이 될 수준까지 발전할 지는 불확실하다. 사실 모질라가 "플랫폼"에 대한 도전자로서 맨 처음 나타난 존재는 아니다. 넷스케이프와 자바가 여기에 나섰지만 윈도우즈 독점에 힘입은 마이크로소프트는 언제나 자신을 변화시키려하는 이들을 바꿔놓곤 했다.

하지만 포터와 보즈웰은 모질라 개발 모델에 대해 긍정적이다. 쉽기 때문이다. 포터의 말이다.

"자바보다 훨씬 낫습니다. 웹사이트를 만드는 사람들 모두 지금까지의 수단에 지칠테죠. 고차원적인 사이트를 만드는 이들이라고 자바를 알진 못합니다. 그저 자바스크립트랑 스타일 쉬트만 알 뿐이죠. 모질라로 만들기 위해 필요로하는 요구 사항과 동일해요. 즉, 자바스크립트와 스타일 쉬트만 알면 모질라에서 프로그래밍을 단순하고 쉽게 할 수 있습니다. 조금만 작성한 프로그램이라도 웹페이지처럼 작동할 겁니다. 결국 웹마스터들은 그 콘텐츠를 스스로 통솔하겠죠. 골프 프로그램을 시작하기 위해 골프 웹 사이트를 방문해야하는 일은 없을 겁니다. 더군다나 브라우져라뇨. 이건 브라우저의 문제가 아니죠."
- - - - - - - - - - - -
About the writer
Farhad Manjoo is a staff writer for Salon Technology & Business.
  Reply With Quote
2002-10-04, 01:23 AM   #2
sharejoy
Senior Member
 
sharejoy's Avatar
 
Registered: Nov 2001
My Mac: iBook 500 Combo
Posts: 244
오프라인
조금은 바른 방향의 글이지만, 웹의 발전방향에 대한 글이거든요.

관심 있으신 분은 읽어보세요.

출처는 IEEE Spectrum 9월호의 Special R&D Report입니다.








SPECIAL R&D REPORT


Weaving A Web of Ideas


Engines that search for meaning rather than words will make the Web more manageable



By Steven M. Cherry, Senior Associate Editor

Remember software agents? Our own little software robots, they were
supposed to represent us on the World Wide Web, which was
already shaping up to be more information than any unaided
human could sift through. sem01.jpgThese agents were going to know all about our needs, likes, and
interests. They would forage every night for news and information,
book our business travel for us, even do the preliminary research
for our next management report.


It never happened. These robots were hard to build—too hard, actually.
After all, Web pages are designed for human consumption. Words
have meaning, indeed, multiple meanings: Is a particular document
on "banking" about saving money or turning an airplane? The
cues we use to derive meaning—position on the page, context,
graphics, and other nontext elements—were beyond any
software agent's ken. And some of the best information on
the Web was hidden in databases that agents couldn't enter.


Now committees of researchers from around the globe are attacking the problem
from the other direction. They want to make the Web more homogeneous,
more data-like, more amenable to computer understanding—and
then agents won't have to be so bright. In other words, if
Web pages could contain their own semantics—if we had
a Semantic Web—software agents wouldn't need to know
the meanings behind the words.


But in the meantime, the Web has continued to grow. By the late 1990s,
the leading search engine of the day, Altavista, could index
only 30 percent of the Web. Searches often missed the most
salient documents, and the ranking of hits with resp ect to
search terms was poor. Just in time, along came Google with
a better indexing engine and vastly better relevance ranking.


While Google can match the Web's astonishing growth, can it keep
up with the expectations of its users? Someone who today says
to a search engine, in effect, "Find some good documents on
compound fractures of the ankle" will soon want to ask what
he or she really wants to know: "Who are the best orthopedic
surgeons near where I live, and are they included in my medical
coverage?"


That sort of query can never be asked of an HTML-based Web. If
we couldn't build intelligent software agents to navigate
a simplistic Web, can we really build intelligence into the
3 billion or 10 billion documents that make up the Web?

While that sounds like moving the mountain to Mohammed, to Tim Berners-Lee,
the inventor of the World Wide Web, it's not out of the question.
The first step is to get a fulcrum under the mountain and
lift it, and it is well under way. That fulcrum is the extensible
markup language (XML). A sort of HTML-on-steroids, this coding
system isolates, under the hood, the dozens or even hundreds
of data elements a Web page might contain. Right now, HTML
coding serves mostly to control the appearance and arrangement
of the text and images on a Web page, so that only a few elements
are tagged, such as <title> and <bold>. With new
XML tags, <price>, for instance, a software agent might
be able to, for example, comparison shop across different
Web sites, or update an account ledger after an e-purchase.


It should come as no surprise that XML is yet another invention spearheaded
by Berners-Lee and the organization he leads, the World Wide
Web Consortium. With offices in Valbonne, France; Cambridge,
Mass.; and Tokyo, and with a full-time staff of more than
60, the W3C, as it's called, brings together about 500 member
organizations. While the IEEE Computer Society is one, most
of the rest are large or mid-sized corporations like DaimlerChrysler
[ranked (4). among the Top 100 R&D
Spenders
], Hewlett-Packard (30), and Autodesk. W3C also
coordinates the work of additional researchers as well as
volunteers from member and nonmember companies and academia.


The Semantic Web is just one item on the W3C's diverse agenda. Others are
interoperability (in file formats, for example) and technologies
for trust, like digital signatures. But the Semantic Web is
increasingly important—four interest groups are working
on its technologies.

 


Similar goal, simpler strategies



While the W3C works hard to coordinate the work of multifarious
organizations, some other companies are overcoming the semantic
shortcomings of a human-oriented Web without either restructuring
it or waiting for smarter agents. Google Inc. (Mountain View,
Calif.) has, to date, not only kept up with the Web's phenomenal
growth, it has added new categories of documents in search
results—PDFs, Usenet newsgroups, and image files. Autonomy
Corp. (Cambridge, UK) and the Palo Alto (Calif.) Research
Center [recently spun off from Xerox (73)], each, in different
ways, use mathematical models of how long-term memory works
in the brain to create concept maps out of the words on Web
pages. At Verity Inc. (Sunnyvale, Calif.), researchers add
things like organization charts and address books to infuse
amorphous corporate documents with additional structure.


What companies like Google, Autonomy, and Verity are doing, in
other words, is figuring out better ways of doing what search
engines have always tried to do: deliver the best documents
the existing Web has on a given topic. The advocates of the
Semantic Web, on the other hand, are looking beyond the current
Web to one in which agent-like search engines will be able
to not just deliver documents, but get at the facts inside
them as well. One thing everyone can agree on: even with its
billions of pages and countless links, the Web, only a dozen
years old, is still in its infancy. As Berners-Lee puts it,
the next generation of the Web will be as revolutionary as
the original Web itself was..

 


From words to concepts



The ideas behind the Semantic Web are innovations that simply
extend current Web techniques in ways that make documents
more datalike, so that agents can interact with them in sophisticated
ways.


For instance, URIs (uniform resource identifiers) are like URLs (uniform
resource locators), but more general: a URL (such as http://www.spectrum.ieee.org/index.html)
is a link to an entity on the Web, while a URI identifies
resources, in general. (All URLs are URIs, while the reverse
isn't the case.) For Berners-Lee, items like human beings,
corporations, and bound books in a library are resources,
just not "network retrievable" ones.


XML builds on a second fundamental Web technique: coding elements in
a document. With the current scheme, HTML, such codes as <title>
for an article's title, <bold> for boldface type and
<table> to begin a table, identify document elements
only stylistically. XML, however, singles things out as data
elements—as dates, prices, invoice numbers, and so on.
In fact, XML allows users to mark up any data elements whatsoever.


The resource description framework (RDF) is the third component of the
Semantic Web. An RDF makes it possible to relate one URI to
another. It is a sort of statement about entities, often expressing
a relation between them. An RDF might express, for example,
that one individual is the sister of another, or that a new
auction bid is greater than the current high offer. Ordinary
statements in a language like English can't be understood
by computers, but RDF-based statements are computer-intelligible
because XML provides their syntax—marks their parts of
speech, so to speak.


The Semantic Web notion that ties all the others together is that of an
ontology—a collection of related RDF statements, which
together specify a variety of relationships among data elements
and ways of making logical inferences among them. A genealogy
is an example of an ontology. The data elements consist of
names, the familial relationships (like sisterhood and parenthood)
that hold between them, and logical rules (if X is Y's sister,
and Z is Y's daughter, then X is Z's aunt, and so on).


"Syntax," "semantics," and "ontology" are concepts of linguistics and
philosophy. Yet their meanings don't change when used by the
theorists in the Semantic Web community. Syntax is the set
of rules or patterns according to which words are combined
into sentences. Semantics is the meaningfulness of the terms—how
the terms relate to real things. And an ontology is an enumeration
of the categories of things that exist in a particular universe
of discourse (or the entire universe, for philosophers).


Such are the building blocks of the Semantic Web, and from them
come expansive visions of the next Web. Those visions could
be seen in the futuristic scenes Berners-Lee painted in an
article last year for Scientific American. In one, your mother
needs to see a medical specialist, so a software agent invoked
by your browser looks up potential providers, insurance coverages,
location maps, and your schedule, and suggests a particular
doctor and appointment times.


"That won't happen in three or five years," Berners-Lee told
IEEE Spectrum.
"But a lot of little things that could
make our lives a lot easier will happen by then." A search
engine today, he notes, might rank pages describing doctors
by how many other Web pages link to them. But an agent-personalized
search engine might rank them according to the criteria you're
concerned with: specialization, location, and insurance-plan
coverage.


Or consider a basic office task, an e-mail invitation to an out-of-town
meeting complete with a directive to view the meeting details
on a company Web page. Today, the recipient accepts the invitation,
then cuts and pastes information into a calendar, an itinerary,
an e-mail to a travel agent, a travel site query, and so on.


"Consider the alternative," Berners-Lee suggests. "Suppose the Semantic
Web part of your browser says 'Oh, we have an entity of type
meeting.' One thing you can do with anything of that
type is right-click on it and select 'accept the appointment'."
[See figure]


The semantics of accepting a meeting invitation entails some very simple
rules that require a start time and an end time. The browser
finds the rules in an RDF and converts them into a vocabulary
understood by your calendar. The RDF can in addition trigger
the transfer of contact information for the people running
the meeting, after picking it up from an address book. At
a Web travel site, the destination and departure and return
dates will already be entered. Just eliminating all the cutting
and pasting, says Berners-Lee, will be an enormous benefit.


People express things like dates and locations in a hundred different
ways. Only when they're all identified as such can software
take information from disparate Web pages and databases and
turn them into items like appointments and departure times.


Berners-Lee seems a bit embarrassed now by the grandiose nature of the
examples in the Scientific American article. In another
of them, the Semantic Web is responsible for the radio's volume
lowering when a telephone rings, while in a third it books
an entire business trip, including conference attendance,
airline reservations, hotel, and rental car. But Eric Miller,
who heads the W3C's technical work on the Semantic Web and
was a co-author of the article, isn't at all abashed.


"Maybe a Web agent can't book your entire business trip today," Miller
says. "Some day it will. But the baby steps we're now taking
are worthy in their own right. If you can make all the travel
arrangements in an hour instead of half a day, and you get
a cheaper hotel rate because your Semantic Web agent noticed
a corporate discount, that's a big help."

 


Still searching after all these years



The current king of the Web search world, Google, doubts the Web
will ever be remade so as to be navigable by computers on
their own. "It's going to be very hard," says Peter Norvig,
Google's director of search quality. "Markup is an effort,
there has to be a return." Norvig thinks that most Web page
creators have little incentive to do the detailed markup required
by XML. He notes that most users "don't even use today's simplest
form of markup, word processor styles such as 'title' or 'body
text.' Instead of adding structure, they set something in
20-point bold."


Norvig concedes that specific corners of the Web may use XML encoding
and Semantic Web intelligence. "It can take off in e-commerce,
for example, if there's a consortium of buyers in the automobile
industries," he says.


Car parts are also on Jonathan Dale's mind. Dale is a member of the
W3C's Web Ontology Group and a researcher at Fujitsu (26)
Laboratories of America Inc., itself a corporate member of
the W3C. The Sunnyvale, Calif., company is particularly interested
in supply chain management, Dale explains. "For example, Ford
doesn't make its own windshields. The time between ordering
and receiving them might be as long as nine months, and if
the supplier doesn't get it right, you could have some real
problems. If you could get that down to one month, there would
be a real benefit."


Manufacturing data, production schedules, delivery and purchase orders,
and inventories all refer to many of the same entities, such
as dates, weights, and part numbers. If they were part of
the same ontology, the information could flow across databases
within a company's operations, such as purchasing and warehousing,
and even across companies, such as to and from a supplier's
invoices and shipping orders.


One early example of the Semantic Web vision is the way Amazon.com Inc.
(Seattle, Wash.) has created an XML version of its database.
For some time, Amazon has provided rudimentary tools to equip
another Web site to create HTML pages listing books in the
Amazon inventory and creating a purchase list that carries
back to Amazon's site. The company now provides RDF-like tools
for another company's developers to integrate Amazon purchases
with their own. Thus, for example, one company could create
a single shopping cart with items ordered from Amazon as well
as from its own catalog. Under the term "Web services," which
is being seen more and more, IBM's (5) WebSphere, Sun Microsystems'
(42) Open Net Environment, and Microsoft's (12) .NET each
provide metadevelopment tools of the sort that make Amazon's
toolkit possible.


R.V. Guha, an IBM researcher and one of the inventors of RDF, predicts:
"In a few years, just as every company has a www.company.com,
providing human-readable information about the company, its
offerings, etc., it will have a xml.company.com or data.company.com
which provides the same information in a machine-readable
form."

 

Brainy
search methods



Valuable as the Semantic Web might be, it won't replace regular Web
searching. Peter Pirolli, a principal scientist in the user
interface research group at the Palo Alto Research Center
(PARC), notes that usually a Web querier's goal isn't an answer
to a specific question. "Seventy-five percent of the time,
people are engaged in what we call sense-making," Pirolli
says. Using the same example as Berners-Lee, he notes that
if someone is diagnosed with a medical problem, what a family
member does first is search the Web for general information.
"They just want to understand the condition, possible treatments,
and so on."


PARC researchers think there's plenty of room for improving Web
searches. One method, which they call scatter/gather, takes
a random collection of documents and gathers them into clusters,
each denoted by a single topic word, such as "medicine," "cancer,"
"radiation," "dose," "beam." The user picks several of the
clusters, and the software rescatters and reclusters them,
until the user gets a particularly desirable set. According
to Stuart Card, manager of the group, "The user gains an effective
mental model of the topic area, and can get a good sense of
what's in a million documents in about 15 minutes."


The method works by precomputing a value for every word in the collection
in relation to every other word. "The model is a Bayesian
network, which is the same model that's used for describing
how long-term memory works in the human brain," Card says.
The
current king of the Web search world, Google, doubts the Web
will ever be navigable by computers on their own


According to this picture of long-term memory (there are others), neurons
are linked to one another in a weighted fashion (represented
by synapses). These connection-weights are strengthened whenever
a pattern of neural activity includes both neurons. Thus frequently
associated neurons can activate one another. For example,
if your grocer stocks peanut butter on the same shelves as
the bread, you might think of jelly, if that's a common sandwich
combination for you. The unseen jelly is the activated, or
associated, concept [see figure, p.65]. Given a way of assigning
weights to the links between concepts, this model can also
describe concepts in a concept space. And a concept space
is one way to think of terms in a document collection, such
as the World Wide Web.


For Autonomy, Bayesian networks are the starting point for improved searches.
The heart of the company's technology, which it sells to corporations
like General Motors (2) and Ericsson (11), is a pattern-matching
engine that distinguishes different meanings of the same term
and so "understands" them as concepts. Autonomy's system,
by noting that the term "engineer" sometimes occurs in a cluster
with others like "electricity," "power," and "electronics"
and sometimes with "cement," "highways," and "hydraulics,"
can tell electrical from civil engineers. In a way, Autonomy
builds an ontology without XML and RDFs.


Autonomy uses other techniques as well, such as tacit profiling, which
tracks an employee's use of a bunch of related concepts in
searching either the Internet or corporate documents and databases.
When another employee does a search on one of those concepts,
the others are suggested. Alternatively, documents that one
person seems to find useful become suggestions for the other.
Even the very person can become a recommendation: "Jane seems
to be looking at the same things, here's her e-mail address."


Another leading company in search engine technology is Verity, with
customers like Compaq and Ernst & Young. It also uses
profiling and other techniques, leveraging the "power of the
social network," according to the company's chief technology
officer Prabhakar Raghavan. Search technologies are, to his
way of thinking, a means of adding value to documents after
they're created. "Structure is value. When you navigate a
Yahoo taxonomy, Yahoo has added structure. Google ranks pages
by analyzing link structure [to other Web sites]."


Verity therefore adds value by adding more structure. For example,
an organization chart implicitly links pieces of information.
"Similarly, classifying some documents as product sheets,
or as written in English, or as having been modified in the
last week, creates implicit links," says Raghavan. He notes
that Google's method of ranking Web pages (it ranks a document
highly if other documents link to it) wouldn't even work within
an enterprise, where most content isn't hyperlinked in the
first place.


Verity and Google agree on one issue, however. Like Norvig, Raghavan
questions whether companies and individuals will go through
the expense and effort of detailed XML tagging and RDF building.
"Tim Berners-Lee has a nice point," Raghavan says, "If everyone
would conform to a standard tagging scheme, the world would
be a wonderful place. But history has taught us that what's
individually advantageous doesn't align with what's socially
advantageous."


Ironically, though, semantic technologies like those of Verity and Autonomy
can reduce those costs. The same categorization algorithms
that make their search tools so powerful can be used to automate
XML tagging. Indeed, because two individuals probably won't
tag the same document identically, automated tagging may be
more consistent.


Are there 10 billion documents on the Web? The fact that no one knows
is indicative of how wild a frontier it still is. As the Web
continues to grow at a rate not unlike that of Moore's Law,
it will take both the Semantic Web and the concept-mapping
tools of the search companies to tame it.


See To Probe Further




ARTWORK: ROBERT LEWIS

 


__________________
Salsaholic - 춤바람 났다~

sharejoy 님께서 2002-10-04 01:42 AM 에 수정하셨습니다..
  Reply With Quote
지금 시각: 09:17 PM | Contact Us | 아카이브 | Top
SEO by vBSEO 3.0.0 RC5 All contents copyright © 2001~2008 by AppleForum and/or their respective owners.