FW: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum "Informatyki"

FYI

  _____  

From: ####@####.#### ####@####.#### On
Behalf Of Włodzimierz Wypych
Sent: Wednesday, November 28, 2012 2:04 PM
To: Lista dyskusyjna sekcji historycznej PTI
Cc: ST PTI; ####@####.####
Subject: Re: [Pti-klio]FW: [PTI-L] Re: [PTI-L] RE: Pośrednio o archiwum
"Informatyki"

Przyjmuję do wiadomości, że w systemie dLibra stałość odsyłaczy do
konkretnych dokumentów cyfrowych ("wydań") nie jest gwarantowana. Rozważanie
tego -- skądinąd zdumiewającego -- rozwiązania na liście dyskusyjnej Sekcji
Historycznej PTI nie ma jednak chyba sensu. Sprawę adresowania zasobów w
systemie dLibra podniosłem w szczególnym kontekście, mianowicie w związku z
przygotowywanym archiwum miesięcznika "Informatyka". Warto bowiem wiedzieć,
jak z zasobu tego moglibyśmy korzystać, gdyby został udostępniony w
bibliotece opartej na systemie dLibra. Załóżmy, że poszczególne numery będą
dokumentami DjVu i będziemy chcieli adresować poszczególne strony w obrębie
każdego numeru, aby wskazać np. pewien artykuł lub jego fragment. Nie jest
to chyba wymagania szczególnie wymyślne. Mam pytanie do Pana Werli: jak
wyglądałby w takim przypadku URL, którego stałość byłaby w systemie dLibra
gwarantowana i który można by bez obaw podać w rozprawie z zakresu historii
informatyki.

Włodzimierz Wypych
================

W dniu 27 listopada 2012 12:35 użytkownik ady,dlaPTI ####@####.####
napisał:

Wątek rozpoczęty na liscie Klio

</ady>

  _____  

From: ####@####.####
####@####.#### On Behalf Of Marcin Werla
Sent: Tuesday, November 27, 2012 9:52 AM
To: ####@####.####
Cc: Lista dyskusyjna sekcji historycznej PTI; ST PTI
Subject: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum
"Informatyki"

Szanowni Państwo, 

Jako osoba odpowiedzialna za rozwój oprogramowania dLibra chciałbym odnieść
się do opisanej w tym wątku mailowym sytuacji powstałej na gruncie
korespondencji jaką prowadził Pan Włodzimierz Wypych z PTI z zespołem pomocy
technicznej systemu dLibra. 

Pan Wypych pytał o znaczenie wybranych adresów URL w dLibrze. Jako przykład
podał on dwa URLe, za pomocą których dLibra daje czytelnikom dostęp do
metadanych i treści na poziomie konkretnych wersji publikacji (czyli wydań w
terminologii dLibry). Ze względu na możliwość tworzenia kolejnych wersji
(wydań) cyfrowych publikacji takie URLe są przez nas traktowane jako
nietrwałe i nie są rekomendowaną formą odwoływania się do publikacji z
dLibry w innych serwisach. Zamiast nich zalecamy używanie linków
funkcjonujących na poziomie całej publikacji (a nie konkretnego,
potencjalnie zmiennego, wydania). 

W związku z tą fundamentalną różnicą, w odpowiedzi przekazaliśmy informację
na temat znaczenia URLi do wydania z komentarzem, że adresy te nie są
formalnie nigdzie udokumentowane. Ponadto, w dalszym toku korespondencji
zespół pomocy technicznej dLibra, przekazał wyjaśnienie, że stałą konwencją
w dLibrze jest wspomniane powyżej odwoływanie się do zasobów poprzez
identyfikator publikacji. 

Dla przykładu - zamiast odwoływać się przez URL typu: 

http://rcin.org.pl/igipz/dlibra/docmetadata?id=2289 (opis) 
http://rcin.org.pl/igipz/Content/2289 (treść) 

zalecamy stosowanie stałego odnośnika: 

http://rcin.org.pl/igipz/publication/13932 (opis) 
http://rcin.org.pl/igipz/publication/13932/content (treść) 

Przy czym stałym systemowym identyfikatorem  publikacji jest tu numer 13932.
Jest to o tyle istotne, że jeśli w toku prac redakcyjnych redaktor
biblioteki cyfrowej zaktualizuje publikację lepszym lub poprawionym zestawem
plików to pierwszy adres będzie wskazywał zawsze na stare pliki, a druga
forma wskazuje na publikację z aktualną wersją plików w danym obiekcie
biblioteki cyfrowej. Redaktor natomiast zawsze widzi wszystkie wersje danej
publikacji w swojej aplikacji. 

Uważamy, że jest to jedna z istotnych zalet bibliotek cyfrowych, gdyż dzięki
takiemu podejściu możliwe jest posiadanie stałego odnośnika niezależnie od
tego czy twórcy biblioteki cyfrowej udostępnią kolejną wersję (wydanie)
danego obiektu. W przypadku istnienia wielu równoczesnych publicznie
dostępnych wydań czytelnik ma oczywiście możliwość wyboru pomiędzy nimi. 

Model taki jest wykorzystywany przez wiele serwisów linkujących obiekty z
bibliotek cyfrowych czy elektroniczne katalogi biblioteczne (link do
obiektów w bibliotekach cyfrowych znajduje się w polu "Źródło
elektroniczne"), np.: 

http://uam-hip.pfsl.poznan.pl/ipac20/ipac.jsp?session=13CU91246E283.146004
<http://uam-hip.pfsl.poznan.pl/ipac20/ipac.jsp?session=13CU91246E283.146004&
profile=bu-uam&uindex=SW&term=Prawo%20podatkowe%20--%20Czechos%C5%82owacja%2
0--%201900-1945.&aspect=subtab13&menu=search&source=%7E%21buam>
&profile=bu-uam&uindex=SW&term=Prawo%20podatkowe%20--%20Czechos%C5%82owacja%
20--%201900-1945.&aspect=subtab13&menu=search&source=~!buam 

Stosowany przez nas schemat adresów WWW faktycznie nie był precyzyjnie
udokumentowany w dokumentacji dostępnej dla użytkowników systemu, ponieważ
zakładaliśmy, że jest to wewnętrzna sprawa systemu i wystarczy jeżeli jest
to opisane w naszej wewnętrznej dokumentacji projektowej. Linki, których
stosowanie rekomendujemy są podane przy opisie każdej z publikacji, w
zakładce "Informacje". 

Podkreślam również, że przyjęty przez nas schemat adresów nie jest
rozwiązaniem ad hoc. Funkcjonuje on w niezmienionej postaci  co najmniej od
2004 roku. Żeby uniknąć dalszych wątpliwości udostępniliśmy jednak
rozszerzoną informację na ten temat jako dodatek do dokumentacji systemu
dLibra: 

https://confluence.man.poznan.pl/community/x/q4RsAQ 

Kończąc, zwracamy uwagę na fakt, że sposób realizacji odwołań do treści
bibliotek cyfrowych poprzez bezpośredni link do treści plików w większości
serwisów agregujących nie jest praktycznie używany. Do dobrej praktyki
zalicza się bowiem umożliwienie czytelnikowi dotarcie również do metadanych,
m.in. do informacji o właścicielu praw autorskich czy licencji na jakiej
dostępny jest obiekt. Jest to rozwiązanie, które Poznańskie Centrum
Superkomputerowo-Sieciowe wypracowało w efekcie trwającej już ponad 10 lat
współpracy z bibliotekarzami i użytkownikami ponad 80 wdrożeń dLibry w
Polsce. Z punktu widzenia etyki Internetu i utrzymywania właściwych relacji
autorskich, przyjęte przez nas rozwiązanie posiada zdecydowaną przewagę nad
bezpośrednim dołączaniem treści przez serwisy linkujące. 

-- 
Z poważaniem, 
Marcin Werla ####@####.####
Lider Zespołu Bibliotek Cyfrowych - Dział Usług Sieciowych 
Poznańskie Centrum Superkomputerowo-Sieciowe 
http://dl.psnc.pl/ 

W dniu 21 listopada 2012 12:37 użytkownik ady,dlaPTI ####@####.####
napisał:

Są to typowe błędy pierworodne amatorów. Podobny błąd pierworodny ma
Wikipedia, np. z brakiem mozliwości generowania w kategoriach listy haseł
występujacych z małej litery. 

Rezultat nonszalancji (czy braku wyobraźni?) objawia się np. tutaj

http://pl.wikipedia.org/wiki/Kategoria:Tablety_PC

(ad)

Ps: wysyłam kopię poniższej uwagi na terminologiczną listę dyskusyjną, jedną
z nielicznych list PTI, które mają archiwa otwarte dla niezarejestrowanaych.

  _____  

From: ####@####.#### ####@####.#### On
Behalf Of Włodzimierz Wypych

Sent: Wednesday, November 21, 2012 9:51 AM
To: pti-klio
Subject: [Pti-klio] Pośrednio o archiwum "Informatyki"

Sprawa, którą chcę tu poruszyć wiąże się pośrednio z tworzonym archiwum
"Informatyki". Chodzi mianowicie o sposób adresowania zasobów w bibliotekach
cyfrowych korzystających z systemu dLibra rozwijanego przez Poznańskie
Centrum Superkomputerowo-Sieciowe. Otóż, parę tygodni temu zwróciłem się do
PCSS z pytaniem, gdzie w dokumentacji tego systemu określony został schemat
adresowania, w szczególności zaś URL w postaci
"http://biblioteka/Content/123", który używany jest do wskazania konkretnego
dokumentu opatrzonego w przykładowej "bibliotece" przykładowym
identyfikatorem "123". 

Otrzymałem zadziwiającą odpowiedź. Okazało się bowiem, że sposób adresowania
w systemie dLibra nie jest nigdzie udokumentowany, jest tylko przyjętą ad
hoc konwencją, a jego utrzymanie w przyszłości nie jest -- jak podkreślono -
w żaden sposób gwarantowane. 

Stwierdzenie to odbieram jako świadectwo wyjątkowej nonszalancji. Jasne jest
bowiem, że zmiana sposobu adresowania zdeaktualizuje wszystkie dotychczasowe
referencje do dokumentów zgromadzonych w bibliotekach cyfrowych i zniweczy
efekty pracy tych, którzy te zasoby opracowują. 

Jeśli system wykorzystywany przez większość bibliotek cyfrowych w Polsce
oparty jest nieudokumentowanej konwencji, to biblioteki te przypominają
zamki z piasku. Poważne repozytoria, w których gromadzone mają być dokumenty
naszego dziedzictwa, muszą opierać na jasno zdefiniowanej normie
informatycznej, która będzie gwarantować, że środki przeznaczone na
digitalizację i opracowanie polskiego piśmiennictwa w wersji cyfrowej nie
zostaną zmarnotrawione. 

Kopię listów wymienionych z PCSS przekazałem Panu Jerzemu Nowakowi. Uważam
bowiem, że "Informatyka", o której digitalizację Pan Jerzy tak długo
zabiegał, stanowi doniosłe źródło historyczne, a sposób adresowania, jaki
zostanie przyjęty w archiwum cyfrowym "Informatyki" powinien zostać
zdefiniowany wzorowo i obowiązywać po wsze czasy -- a przynajmniej tak
długo, jak korzystać będziemy z protokołu HTTP. 

Włodzimierz Wypych

================

_______________________________________________
Pti-klio mailing list
####@####.####
http://poczta.pti.net.pl/mailman/listinfo/pti-klio

Lista dyskusyjna sekcji historycznej
Polskiego Towarzystwa Informatycznego

Previous by date:	28 Nov 2012 13:38:05 +0000 FW: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum "Informatyki", "ady,dlaPTI"
Next by date:	28 Nov 2012 13:38:05 +0000 słuchawki nauszne, "ady,dlaPTI"
Previous in thread:
Next in thread:

Previous by date:	28 Nov 2012 13:38:05 +0000 FW: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum "Informatyki", "ady,dlaPTI"
Next by date:	28 Nov 2012 13:38:05 +0000 słuchawki nauszne, "ady,dlaPTI"
Previous in thread:
Next in thread:

st-pti: FW: [Pti-klio]FW: [PTI-L] Re: [PTI-L] RE: Pośrednio o archiwum "Informatyki"