Sử dụng các khung phân loại thư viện để tìm tài nguyên trên Internet
06.12.2013 10:25
Các chuyên gia và thủ thư từ lâu đã công nhận tiềm năng của những chương trình phân loại dùng cho thư viện để truy cập thông tin theo chủ đề tốt hơn. Trong một bài báo đăng hồi năm 1983, Svenonius mô tả một vài phương cách sử dụng hệ phân loại trong các hệ thống thu thập thông tin trực tuyến, gồm những mục tiêu sau đây:
(1) Làm sao có thể tìm chính xác hơn, và có thể
gọi lại được,
(2) Tạo được bối cảnh cho các từ tìm kiếm,
(3) Cho phép trình duyệt
(4) Sử dụng như một cơ chế để chuyển từ ngôn ngữ
này sang ngôn ngữ khác.
Trong dự án trực tuyến Hệ phân loại thập phân
Dewey (DDC) (Markey và Demeyer 1986), Markey đã thực hiện lần đầu tiên hệ phân
loại thư viện đến tận người sử dụng cho họ truy cập chủ đề, và duyệt trình. Mặc
dù nhiều biên mục trực tuyến cho phép truy cập theo ký hiệu riêng , rất ít
cơ quan sử dụng hệ phân loại theo cách mà Svenonius mô tả hoặc do Markey
tìm hiểu trong ý tưởng sử dụng DDC sáng tạo trên biên mục thử nghiệm trực
tuyến, mà biên mục này cho phép người sử dụng trực tuyến tìm kiếm theo phân
loại. Mãi đến thời gian gần đây, gần 10 năm sau nghiên cứu tiên phong của
Markey, việc sử dụng ký hiệu phân loại trực tuyến mới được xem xét nghiêm túc
như một công cụ để cho chúng ta những khả năng duyệt trình tiên tiến và truy
xuất dữ liệu trong các hệ thống trực tuyến.
Số liệu phân loại trực
tuyến
Một số yếu tố gây chậm chễ cho việc ứng dụng Hệ
phân loại DDC và Hệ phân loại của Thư viện Quốc Hội Mỹ (LCC) là mã hóa để đọc
được trên máy. Quá trình tin học hóa DDC bắt đầu bằng việc đưa ra phiên bản
DDC19 (1979). Việc phát triển này và phần nghiên cứu của Markey đã gợi mở
cho Forest Press, hồi năm 1984, chạy thử phần mềm Inforonics- hệ hỗ trợ hiệu
đính trực tuyến (ESS) cho Phân loại Dewey. Các bạn có thể xem thêm hai tác giả
Finni và Paulson (1987) về phần mô tả cách thức triển Dewey ESS. Hệ thống đó- kết
quả của phần thực hiện này, và cơ sở dữ liệu đã được sử dụng để cho ra đời DDC
20 (1989), hệ phân loại đầu tiên sử dụng hệ thống hỗ trợ hiệu đính trực tuyến.
Hệ thống phân loại và
Internet
Phiên bản điện tử của DDC giúp ta có thể hiện
thực hóa tiềm năng của hệ phân loại thư viện để giúp việc truy xuất theo chủ đề
dễ dàng hơn; tuy nhiên, nhiều mối quan tâm mới trong phân loại – coi đó như là
một thiết bị để tổ chức và truy xuất các nguồn thông tin đã bừng sáng cùng sự
phát triển sử dụng Internet và Mạng rộng toàn cầu World Wide Web (WWW).
Một vài địa chỉ WWW cho phép người sử dụng khả
năng tìm kiếm theo từ và cụm từ để truy xuất những chủ điểm và nội dung họ quan
tâm, với hai địa chỉ thông dụng nhất là Yahoo và Infoseek, bổ sung thêm
khả năng cho người sử dụng định hướng thông qua một loạt những hạng loại xắp
xếp theo chủ đề để phát hiện những tài liệu liên quan tiềm năng khác. Mặc dầu
Yahoo và Infoseek sử dụng thiết yếu đầu vào như nhau (tài liệu WWW và các tệp
tài liệu của các nhóm thông tin Internet) làm cơ sở cho các cấu trúc chủ đề,
những hạng loại được trình ra cho người sử dụng hoàn toàn khác nhau. Chủ đề lớn
như “Giáo dục” được tìm thấy ở lớp trên cùng của cả Yahoo và Infoseek. Tuy
nhiên, lớp tiếp theo đó dưới mục “Giáo dục” trong từng hệ thống lại là một tổ
chức rất khác với chủ đề.
Trong Yahoo (see appendix A) http://www.yahoo.com/ có hơn 30 tiểu
hạng loại duyệt trình các chủ điểm liên quan đến giáo dục trong khi đó Infoseek
(see appendix B) http://guide.infoseek.com/ trình bày đề
cương của người học.
Các chương trình phân loại thư viện từ lâu đã có
công cụ tương tự cho các tài liệu thư viện. Những hạng loại theo chủ điểm tìm
thấy trong DDC dựa nhiều trên những chủ đề trong các tài liệu chuyên khảo dạng
thức của sách truyền thống. Đối với sách in thì những phần tóm tắt của Deweyhttp://www.oclc.org/fp/ nêu đại cương có
chức năng tương đương phân hạng loại theo chủ điểm của Yahoo và Infoseek. Trong
thực tế, một số địa chỉ phi thương mại của WWW đang sử dụng DDC để cho mọi
người truy cập theo chủ điểm đến những tài liệu có thể truy cập được trên Web
(mạng thông tin toàn cầu).
Những đặc tính chính của
DDC và LCC
DDC và LCC là những hệ thống phân loại
chung
Chan, Comaromi, và Satija nhắc nhở chúng ta rằng
mục đích của Hệ phân loại thập phân Dewey là xắp xếp chung phần thu thập tài
liệu “DDC nhằm phân loại sách và tài liệu khác về tất cả các chủ điểm của tất
cả các ngôn ngữ trong bất kỳ kiểu thư viện nào.” Cũng giống như thế, LCC
được thiết kế để cho ta một trật tự thu thập chung, bộ thu thập của Thư viện
Quốc hội Mỹ. Mặc dù dựa trên bộ thu thập của một thư viện duy nhất, Hệ phân
loại LC đã được nhiều thư viện nghiên cứu và hàn lâm chấp nhận ứng dụng thành
công.
DDC và LCC có một cấu trúc theo tầng bậc
Mối quan hệ tầng bậc là bản chất của tất cả các
loại phân loại. Các hệ phân loại có tính liệt kê, cho ta xắp xếp các chủ điểm
theo bộ nguyên tắc dựa trên triết lý về tổ chức kiến thức đã được chấp nhận,
theo những mẫu đã được thiết lập trên cơ sở bảo đảm tác quyền, và thường là kết
hợp cả hai. Tuy nhiên, trật tự xếp loại bản thân nó không tự minh chứng. Cần phải
có một phương pháp nào đó, hoặc phương tiện nào đó để duy trì mối quan hệ giữa
các ngàng, tiểu ngành, chủ đề và tiểu đề. Ví dụ trong DDC, những mối quan hệ
này được duy trì và hoạt động thông qua ghi chú tầng bậc. LCC thì không theo
kiểu mẫu này. Phần ghi chú duy trì trật tự xắp xếp song lại không phản ánh tầng
bậc.
600 |
Technology (Applied sciences) |
660 |
Chemical engineering and related technologies |
663 |
Beverage technology |
663.2 |
Wine and wine making |
663.22 |
Specific kinds of grape wine |
663.222 |
White wine |
663.223 |
Red wine |
663.224 |
Sparkling wine |
Trong hệ Phân loại LC và trong các cây hạng loại
của Yahoo, tầng bậc được thể hiện bằng chấm thụt đầu dòng của hạng loại và tên
ngành.
Computers and Internet Internet Entertainment Interesting Devices Connected to the Net Spy Cameras Indoor Cameras Outdoor Cameras Pets@ Aquariums
Những ví dụ trên cho thấy rằng cả các chương
trình phân loại Internet và phân loại thư viện cho ta các cấu trúc tầng
bậc hỗ trợ duyệt tìm theo chủ đề. Các chương trình thư viện dường như có lợi
thế hơn so với các chương trình duyệt tìm dựa trên Internet vì có kèm ghi chú
hỗ trợ tìm kiếm các mối quan hệ theo ngành.
Vậy thì chương trình
phân loại thư viện hay các trình duyệt trên Internet?
Bài này chỉ xem xét một số đặc tính của các
chương trình phân loại DDC và LCC cho phép các chương trình này thích hợp với
việc truy cập theo chủ điểm vào các nguồn Internet. Tổng kết lại, DDC và LCC là
:
· Các chương trình phân loại chung.
· Có cấu trúc tầng bậc và ghi chú xếp trình tự các
ngành
· Những liên kết với các chương trình phân loại
chủ điểm khác và
· Những liên kết với phần dịch sang các ngôn ngữ
khác. (hiện nay chỉ DDC mới có)
Cho dù có những lợi thế như vậy, vẫn cần cải
tiến thêm nếu như ta cần sử dụng số liệu phân loại trực tuyến làm công cụ chính
để truy cập các bộ sưu tập truyền thống cũng như các nguồn có thể truy cập được
trên Internet. Những mục cần cải tiến này là:
1. Đánh giá các tiêu đề của DDC và LCC về mức độ
chính xác và diễn đạt.
2. Phân tách và mã hóa các thành phần số ngành để
xác định chủ điểm cụ thể và các lĩnh vực trình bày.
3. Tiếp tục bổ sung thuật ngữ mới làm các từ chỉ
khoản mục cho dù mỗi từ chưa có số riêng.
4. Mở rộng kết nối đến những biểu từ vựng được kiểm
soát khác.
5. Mở rộng định nghĩa bảo đảm tác quyền để gộp các
nguồn Internet vào.
6. Xây dựng những hệ thống trình diễn.
Hiện tại trong bối cảnh của DDC, mục 1 và 2 đã
làm, mục 3 và 4 đang thực hiện cùng với những cam kết trong ngành thư viện.
Phạm Thị Trinh (Theo http://nlv.gov.vn) |