Subject:
FW: [Pti-klio]FW: [PTI-L] Re: [PTI-L] RE: Pośrednio o archiwum "Informatyki"
From:
"ady,dlaPTI" ####@####.####
Date:
28 Nov 2012 13:38:05 +0000
Message-Id:
FYI
_____
From: ####@####.#### ####@####.#### On
Behalf Of Włodzimierz Wypych
Sent: Wednesday, November 28, 2012 2:04 PM
To: Lista dyskusyjna sekcji historycznej PTI
Cc: ST PTI; ####@####.####
Subject: Re: [Pti-klio]FW: [PTI-L] Re: [PTI-L] RE: Pośrednio o archiwum
"Informatyki"
Przyjmuję do wiadomości, że w systemie dLibra stałość odsyłaczy do
konkretnych dokumentów cyfrowych ("wydań") nie jest gwarantowana. Rozważanie
tego -- skądinąd zdumiewającego -- rozwiązania na liście dyskusyjnej Sekcji
Historycznej PTI nie ma jednak chyba sensu. Sprawę adresowania zasobów w
systemie dLibra podniosłem w szczególnym kontekście, mianowicie w związku z
przygotowywanym archiwum miesięcznika "Informatyka". Warto bowiem wiedzieć,
jak z zasobu tego moglibyśmy korzystać, gdyby został udostępniony w
bibliotece opartej na systemie dLibra. Załóżmy, że poszczególne numery będą
dokumentami DjVu i będziemy chcieli adresować poszczególne strony w obrębie
każdego numeru, aby wskazać np. pewien artykuł lub jego fragment. Nie jest
to chyba wymagania szczególnie wymyślne. Mam pytanie do Pana Werli: jak
wyglądałby w takim przypadku URL, którego stałość byłaby w systemie dLibra
gwarantowana i który można by bez obaw podać w rozprawie z zakresu historii
informatyki.
Włodzimierz Wypych
================
W dniu 27 listopada 2012 12:35 użytkownik ady,dlaPTI ####@####.####
napisał:
Wątek rozpoczęty na liscie Klio
</ady>
_____
From: ####@####.####
####@####.#### On Behalf Of Marcin Werla
Sent: Tuesday, November 27, 2012 9:52 AM
To: ####@####.####
Cc: Lista dyskusyjna sekcji historycznej PTI; ST PTI
Subject: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum
"Informatyki"
Szanowni Państwo,
Jako osoba odpowiedzialna za rozwój oprogramowania dLibra chciałbym odnieść
się do opisanej w tym wątku mailowym sytuacji powstałej na gruncie
korespondencji jaką prowadził Pan Włodzimierz Wypych z PTI z zespołem pomocy
technicznej systemu dLibra.
Pan Wypych pytał o znaczenie wybranych adresów URL w dLibrze. Jako przykład
podał on dwa URLe, za pomocą których dLibra daje czytelnikom dostęp do
metadanych i treści na poziomie konkretnych wersji publikacji (czyli wydań w
terminologii dLibry). Ze względu na możliwość tworzenia kolejnych wersji
(wydań) cyfrowych publikacji takie URLe są przez nas traktowane jako
nietrwałe i nie są rekomendowaną formą odwoływania się do publikacji z
dLibry w innych serwisach. Zamiast nich zalecamy używanie linków
funkcjonujących na poziomie całej publikacji (a nie konkretnego,
potencjalnie zmiennego, wydania).
W związku z tą fundamentalną różnicą, w odpowiedzi przekazaliśmy informację
na temat znaczenia URLi do wydania z komentarzem, że adresy te nie są
formalnie nigdzie udokumentowane. Ponadto, w dalszym toku korespondencji
zespół pomocy technicznej dLibra, przekazał wyjaśnienie, że stałą konwencją
w dLibrze jest wspomniane powyżej odwoływanie się do zasobów poprzez
identyfikator publikacji.
Dla przykładu - zamiast odwoływać się przez URL typu:
http://rcin.org.pl/igipz/dlibra/docmetadata?id=2289 (opis)
http://rcin.org.pl/igipz/Content/2289 (treść)
zalecamy stosowanie stałego odnośnika:
http://rcin.org.pl/igipz/publication/13932 (opis)
http://rcin.org.pl/igipz/publication/13932/content (treść)
Przy czym stałym systemowym identyfikatorem publikacji jest tu numer 13932.
Jest to o tyle istotne, że jeśli w toku prac redakcyjnych redaktor
biblioteki cyfrowej zaktualizuje publikację lepszym lub poprawionym zestawem
plików to pierwszy adres będzie wskazywał zawsze na stare pliki, a druga
forma wskazuje na publikację z aktualną wersją plików w danym obiekcie
biblioteki cyfrowej. Redaktor natomiast zawsze widzi wszystkie wersje danej
publikacji w swojej aplikacji.
Uważamy, że jest to jedna z istotnych zalet bibliotek cyfrowych, gdyż dzięki
takiemu podejściu możliwe jest posiadanie stałego odnośnika niezależnie od
tego czy twórcy biblioteki cyfrowej udostępnią kolejną wersję (wydanie)
danego obiektu. W przypadku istnienia wielu równoczesnych publicznie
dostępnych wydań czytelnik ma oczywiście możliwość wyboru pomiędzy nimi.
Model taki jest wykorzystywany przez wiele serwisów linkujących obiekty z
bibliotek cyfrowych czy elektroniczne katalogi biblioteczne (link do
obiektów w bibliotekach cyfrowych znajduje się w polu "Źródło
elektroniczne"), np.:
http://uam-hip.pfsl.poznan.pl/ipac20/ipac.jsp?session=13CU91246E283.146004
<http://uam-hip.pfsl.poznan.pl/ipac20/ipac.jsp?session=13CU91246E283.146004&
profile=bu-uam&uindex=SW&term=Prawo%20podatkowe%20--%20Czechos%C5%82owacja%2
0--%201900-1945.&aspect=subtab13&menu=search&source=%7E%21buam>
&profile=bu-uam&uindex=SW&term=Prawo%20podatkowe%20--%20Czechos%C5%82owacja%
20--%201900-1945.&aspect=subtab13&menu=search&source=~!buam
Stosowany przez nas schemat adresów WWW faktycznie nie był precyzyjnie
udokumentowany w dokumentacji dostępnej dla użytkowników systemu, ponieważ
zakładaliśmy, że jest to wewnętrzna sprawa systemu i wystarczy jeżeli jest
to opisane w naszej wewnętrznej dokumentacji projektowej. Linki, których
stosowanie rekomendujemy są podane przy opisie każdej z publikacji, w
zakładce "Informacje".
Podkreślam również, że przyjęty przez nas schemat adresów nie jest
rozwiązaniem ad hoc. Funkcjonuje on w niezmienionej postaci co najmniej od
2004 roku. Żeby uniknąć dalszych wątpliwości udostępniliśmy jednak
rozszerzoną informację na ten temat jako dodatek do dokumentacji systemu
dLibra:
https://confluence.man.poznan.pl/community/x/q4RsAQ
Kończąc, zwracamy uwagę na fakt, że sposób realizacji odwołań do treści
bibliotek cyfrowych poprzez bezpośredni link do treści plików w większości
serwisów agregujących nie jest praktycznie używany. Do dobrej praktyki
zalicza się bowiem umożliwienie czytelnikowi dotarcie również do metadanych,
m.in. do informacji o właścicielu praw autorskich czy licencji na jakiej
dostępny jest obiekt. Jest to rozwiązanie, które Poznańskie Centrum
Superkomputerowo-Sieciowe wypracowało w efekcie trwającej już ponad 10 lat
współpracy z bibliotekarzami i użytkownikami ponad 80 wdrożeń dLibry w
Polsce. Z punktu widzenia etyki Internetu i utrzymywania właściwych relacji
autorskich, przyjęte przez nas rozwiązanie posiada zdecydowaną przewagę nad
bezpośrednim dołączaniem treści przez serwisy linkujące.
--
Z poważaniem,
Marcin Werla ####@####.####
Lider Zespołu Bibliotek Cyfrowych - Dział Usług Sieciowych
Poznańskie Centrum Superkomputerowo-Sieciowe
http://dl.psnc.pl/
W dniu 21 listopada 2012 12:37 użytkownik ady,dlaPTI ####@####.####
napisał:
Są to typowe błędy pierworodne amatorów. Podobny błąd pierworodny ma
Wikipedia, np. z brakiem mozliwości generowania w kategoriach listy haseł
występujacych z małej litery.
Rezultat nonszalancji (czy braku wyobraźni?) objawia się np. tutaj
http://pl.wikipedia.org/wiki/Kategoria:Tablety_PC
(ad)
Ps: wysyłam kopię poniższej uwagi na terminologiczną listę dyskusyjną, jedną
z nielicznych list PTI, które mają archiwa otwarte dla niezarejestrowanaych.
_____
From: ####@####.#### ####@####.#### On
Behalf Of Włodzimierz Wypych
Sent: Wednesday, November 21, 2012 9:51 AM
To: pti-klio
Subject: [Pti-klio] Pośrednio o archiwum "Informatyki"
Sprawa, którą chcę tu poruszyć wiąże się pośrednio z tworzonym archiwum
"Informatyki". Chodzi mianowicie o sposób adresowania zasobów w bibliotekach
cyfrowych korzystających z systemu dLibra rozwijanego przez Poznańskie
Centrum Superkomputerowo-Sieciowe. Otóż, parę tygodni temu zwróciłem się do
PCSS z pytaniem, gdzie w dokumentacji tego systemu określony został schemat
adresowania, w szczególności zaś URL w postaci
"http://biblioteka/Content/123", który używany jest do wskazania konkretnego
dokumentu opatrzonego w przykładowej "bibliotece" przykładowym
identyfikatorem "123".
Otrzymałem zadziwiającą odpowiedź. Okazało się bowiem, że sposób adresowania
w systemie dLibra nie jest nigdzie udokumentowany, jest tylko przyjętą ad
hoc konwencją, a jego utrzymanie w przyszłości nie jest -- jak podkreślono -
w żaden sposób gwarantowane.
Stwierdzenie to odbieram jako świadectwo wyjątkowej nonszalancji. Jasne jest
bowiem, że zmiana sposobu adresowania zdeaktualizuje wszystkie dotychczasowe
referencje do dokumentów zgromadzonych w bibliotekach cyfrowych i zniweczy
efekty pracy tych, którzy te zasoby opracowują.
Jeśli system wykorzystywany przez większość bibliotek cyfrowych w Polsce
oparty jest nieudokumentowanej konwencji, to biblioteki te przypominają
zamki z piasku. Poważne repozytoria, w których gromadzone mają być dokumenty
naszego dziedzictwa, muszą opierać na jasno zdefiniowanej normie
informatycznej, która będzie gwarantować, że środki przeznaczone na
digitalizację i opracowanie polskiego piśmiennictwa w wersji cyfrowej nie
zostaną zmarnotrawione.
Kopię listów wymienionych z PCSS przekazałem Panu Jerzemu Nowakowi. Uważam
bowiem, że "Informatyka", o której digitalizację Pan Jerzy tak długo
zabiegał, stanowi doniosłe źródło historyczne, a sposób adresowania, jaki
zostanie przyjęty w archiwum cyfrowym "Informatyki" powinien zostać
zdefiniowany wzorowo i obowiązywać po wsze czasy -- a przynajmniej tak
długo, jak korzystać będziemy z protokołu HTTP.
Włodzimierz Wypych
================
_______________________________________________
Pti-klio mailing list
####@####.####
http://poczta.pti.net.pl/mailman/listinfo/pti-klio
Lista dyskusyjna sekcji historycznej
Polskiego Towarzystwa Informatycznego
_______________________________________________
Pti-klio mailing list
####@####.####
http://poczta.pti.net.pl/mailman/listinfo/pti-klio
Lista dyskusyjna sekcji historycznej
Polskiego Towarzystwa Informatycznego