[<<] [<] Page 1 of 1 [>] [>>] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Subject:
FW: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum "Informatyki"
From: "ady,dlaPTI" ####@####.#### Date: 27 Nov 2012 11:35:07 +0000 Message-Id: Wątek rozpoczęty na liscie Klio </ady> _____ From: ####@####.#### ####@####.#### On Behalf Of Marcin Werla Sent: Tuesday, November 27, 2012 9:52 AM To: ####@####.#### Cc: Lista dyskusyjna sekcji historycznej PTI; ST PTI Subject: [PTI-L] Re: [PTI-L] RE: [Pti-klio] Pośrednio o archiwum "Informatyki" Szanowni Państwo, Jako osoba odpowiedzialna za rozwój oprogramowania dLibra chciałbym odnieść się do opisanej w tym wątku mailowym sytuacji powstałej na gruncie korespondencji jaką prowadził Pan Włodzimierz Wypych z PTI z zespołem pomocy technicznej systemu dLibra. Pan Wypych pytał o znaczenie wybranych adresów URL w dLibrze. Jako przykład podał on dwa URLe, za pomocą których dLibra daje czytelnikom dostęp do metadanych i treści na poziomie konkretnych wersji publikacji (czyli wydań w terminologii dLibry). Ze względu na możliwość tworzenia kolejnych wersji (wydań) cyfrowych publikacji takie URLe są przez nas traktowane jako nietrwałe i nie są rekomendowaną formą odwoływania się do publikacji z dLibry w innych serwisach. Zamiast nich zalecamy używanie linków funkcjonujących na poziomie całej publikacji (a nie konkretnego, potencjalnie zmiennego, wydania). W związku z tą fundamentalną różnicą, w odpowiedzi przekazaliśmy informację na temat znaczenia URLi do wydania z komentarzem, że adresy te nie są formalnie nigdzie udokumentowane. Ponadto, w dalszym toku korespondencji zespół pomocy technicznej dLibra, przekazał wyjaśnienie, że stałą konwencją w dLibrze jest wspomniane powyżej odwoływanie się do zasobów poprzez identyfikator publikacji. Dla przykładu - zamiast odwoływać się przez URL typu: http://rcin.org.pl/igipz/dlibra/docmetadata?id=2289 (opis) http://rcin.org.pl/igipz/Content/2289 (treść) zalecamy stosowanie stałego odnośnika: http://rcin.org.pl/igipz/publication/13932 (opis) http://rcin.org.pl/igipz/publication/13932/content (treść) Przy czym stałym systemowym identyfikatorem publikacji jest tu numer 13932. Jest to o tyle istotne, że jeśli w toku prac redakcyjnych redaktor biblioteki cyfrowej zaktualizuje publikację lepszym lub poprawionym zestawem plików to pierwszy adres będzie wskazywał zawsze na stare pliki, a druga forma wskazuje na publikację z aktualną wersją plików w danym obiekcie biblioteki cyfrowej. Redaktor natomiast zawsze widzi wszystkie wersje danej publikacji w swojej aplikacji. Uważamy, że jest to jedna z istotnych zalet bibliotek cyfrowych, gdyż dzięki takiemu podejściu możliwe jest posiadanie stałego odnośnika niezależnie od tego czy twórcy biblioteki cyfrowej udostępnią kolejną wersję (wydanie) danego obiektu. W przypadku istnienia wielu równoczesnych publicznie dostępnych wydań czytelnik ma oczywiście możliwość wyboru pomiędzy nimi. Model taki jest wykorzystywany przez wiele serwisów linkujących obiekty z bibliotek cyfrowych czy elektroniczne katalogi biblioteczne (link do obiektów w bibliotekach cyfrowych znajduje się w polu "Źródło elektroniczne"), np.: http://uam-hip.pfsl.poznan.pl/ipac20/ipac.jsp?session=13CU91246E283.146004 <http://uam-hip.pfsl.poznan.pl/ipac20/ipac.jsp?session=13CU91246E283.146004& profile=bu-uam&uindex=SW&term=Prawo%20podatkowe%20--%20Czechos%C5%82owacja%2 0--%201900-1945.&aspect=subtab13&menu=search&source=%7E%21buam> &profile=bu-uam&uindex=SW&term=Prawo%20podatkowe%20--%20Czechos%C5%82owacja% 20--%201900-1945.&aspect=subtab13&menu=search&source=~!buam Stosowany przez nas schemat adresów WWW faktycznie nie był precyzyjnie udokumentowany w dokumentacji dostępnej dla użytkowników systemu, ponieważ zakładaliśmy, że jest to wewnętrzna sprawa systemu i wystarczy jeżeli jest to opisane w naszej wewnętrznej dokumentacji projektowej. Linki, których stosowanie rekomendujemy są podane przy opisie każdej z publikacji, w zakładce "Informacje". Podkreślam również, że przyjęty przez nas schemat adresów nie jest rozwiązaniem ad hoc. Funkcjonuje on w niezmienionej postaci co najmniej od 2004 roku. Żeby uniknąć dalszych wątpliwości udostępniliśmy jednak rozszerzoną informację na ten temat jako dodatek do dokumentacji systemu dLibra: https://confluence.man.poznan.pl/community/x/q4RsAQ Kończąc, zwracamy uwagę na fakt, że sposób realizacji odwołań do treści bibliotek cyfrowych poprzez bezpośredni link do treści plików w większości serwisów agregujących nie jest praktycznie używany. Do dobrej praktyki zalicza się bowiem umożliwienie czytelnikowi dotarcie również do metadanych, m.in. do informacji o właścicielu praw autorskich czy licencji na jakiej dostępny jest obiekt. Jest to rozwiązanie, które Poznańskie Centrum Superkomputerowo-Sieciowe wypracowało w efekcie trwającej już ponad 10 lat współpracy z bibliotekarzami i użytkownikami ponad 80 wdrożeń dLibry w Polsce. Z punktu widzenia etyki Internetu i utrzymywania właściwych relacji autorskich, przyjęte przez nas rozwiązanie posiada zdecydowaną przewagę nad bezpośrednim dołączaniem treści przez serwisy linkujące. -- Z poważaniem, Marcin Werla ####@####.#### Lider Zespołu Bibliotek Cyfrowych - Dział Usług Sieciowych Poznańskie Centrum Superkomputerowo-Sieciowe http://dl.psnc.pl/ W dniu 21 listopada 2012 12:37 użytkownik ady,dlaPTI ####@####.#### napisał: Są to typowe błędy pierworodne amatorów. Podobny błąd pierworodny ma Wikipedia, np. z brakiem mozliwości generowania w kategoriach listy haseł występujacych z małej litery. Rezultat nonszalancji (czy braku wyobraźni?) objawia się np. tutaj http://pl.wikipedia.org/wiki/Kategoria:Tablety_PC (ad) Ps: wysyłam kopię poniższej uwagi na terminologiczną listę dyskusyjną, jedną z nielicznych list PTI, które mają archiwa otwarte dla niezarejestrowanaych. _____ From: ####@####.#### ####@####.#### On Behalf Of Włodzimierz Wypych Sent: Wednesday, November 21, 2012 9:51 AM To: pti-klio Subject: [Pti-klio] Pośrednio o archiwum "Informatyki" Sprawa, którą chcę tu poruszyć wiąże się pośrednio z tworzonym archiwum "Informatyki". Chodzi mianowicie o sposób adresowania zasobów w bibliotekach cyfrowych korzystających z systemu dLibra rozwijanego przez Poznańskie Centrum Superkomputerowo-Sieciowe. Otóż, parę tygodni temu zwróciłem się do PCSS z pytaniem, gdzie w dokumentacji tego systemu określony został schemat adresowania, w szczególności zaś URL w postaci "http://biblioteka/Content/123", który używany jest do wskazania konkretnego dokumentu opatrzonego w przykładowej "bibliotece" przykładowym identyfikatorem "123". Otrzymałem zadziwiającą odpowiedź. Okazało się bowiem, że sposób adresowania w systemie dLibra nie jest nigdzie udokumentowany, jest tylko przyjętą ad hoc konwencją, a jego utrzymanie w przyszłości nie jest -- jak podkreślono - w żaden sposób gwarantowane. Stwierdzenie to odbieram jako świadectwo wyjątkowej nonszalancji. Jasne jest bowiem, że zmiana sposobu adresowania zdeaktualizuje wszystkie dotychczasowe referencje do dokumentów zgromadzonych w bibliotekach cyfrowych i zniweczy efekty pracy tych, którzy te zasoby opracowują. Jeśli system wykorzystywany przez większość bibliotek cyfrowych w Polsce oparty jest nieudokumentowanej konwencji, to biblioteki te przypominają zamki z piasku. Poważne repozytoria, w których gromadzone mają być dokumenty naszego dziedzictwa, muszą opierać na jasno zdefiniowanej normie informatycznej, która będzie gwarantować, że środki przeznaczone na digitalizację i opracowanie polskiego piśmiennictwa w wersji cyfrowej nie zostaną zmarnotrawione. Kopię listów wymienionych z PCSS przekazałem Panu Jerzemu Nowakowi. Uważam bowiem, że "Informatyka", o której digitalizację Pan Jerzy tak długo zabiegał, stanowi doniosłe źródło historyczne, a sposób adresowania, jaki zostanie przyjęty w archiwum cyfrowym "Informatyki" powinien zostać zdefiniowany wzorowo i obowiązywać po wsze czasy -- a przynajmniej tak długo, jak korzystać będziemy z protokołu HTTP. Włodzimierz Wypych ================ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
[<<] [<] Page 1 of 1 [>] [>>] |