Soubory na ftp severu v adresáři
Soubory na ftp serveru v adresáři autorit, určené ke stahování
(Aktualizace informací 20.3.2006)
Soubory se nacházejí na ftp.nkp.cz v adresáři au/download. Jsou k dispozici všem účastníkům kooperačního projektu, dle dohody dalším zájemcům. Jedná se o autority jmenné i věcné (aktualizace jsou ve společném souboru).
O přidělení loginu pro přístup na ftp je třeba
požádat
dr.Zdeňka Bartla.
Potřebné informace - sigla knihovny, heslo (nejméně 6 znaků; pokud již má
knihovna heslo pro zasílání záznamů do souborného katalogu, může požádat o
používání téhož).
1. export celé báze / jednotlivých typů autorit + kumulované změnové soubory
Pro knihovny Aleph se vytváří výjimečně na
požádání export celé báze ve variantě MARC21 - autvse.m21, a
variantě Unimarc - autvse.uni.
Pro ostatní knihovny se cca 2x ročně nebo na požádání vytvářejí soubory podle
druhu autority - aut_jmen, aut_vec - s příslušnými příponami.
Formát je řádkový UNIMARC, kódování CP-1250 (win) nebo UTF-8 (utf). Soubory
obsahuji všechny platné autority k příslušnému datu.
Před stažením doporučujeme zkontrolovat datum a dle potřeby doplnit
aktualizovanými záznamy (viz 2).
Kumulované změnové soubory jsou
pouze ve variantě řádkový unimarc, v kódování CP-1250 (win) a UTF-8 (utf).
Pořizujeme celkové kumulace a kumulace za uplynulý rok.
Jména souborů:
auj_oz, auj_zr,auj_oc, auv_oz,auv_zr, auv_oc - s příslušnými
příponami
(odpovídají konvenci dle bodu 2).
2. soubory záznamů nových/aktualizovaných
autorit za poslední týden
(export každou sobotu)
Soubory jsou určeny knihovnám s jinými systémy než Aleph používající dosud Unimarc, které si chtějí aktualizovat své vlastní lokální báze autorit a/nebo opravit záhlaví ve svých bibliografických bázích. Počítá se s vazbou na identifikační číslo autority, které se až na zcela výjimečné případy nemění (identifikační čísla, která bylo nutno změnit, většinou z důvodů duplicity způsobené lidskou chybou, jsou potom obsažena ve zvláštním souboru). Soubory začínají w (=weekly) a jsou označeny pořadovým číslem týdne (např. wakt_49, wakt_u_49).
Formát je řádkový UNIMARC.
Standardní soubory jsou v kódování CP-1250. Pro zájemce
pracující v UTF-8 jsou od dubna 2005 k dispozici soubory v originálním kódování
UTF-8, které obsahují pro odlišení ve jménu souboru _u před
číslem týdne.
Druhy souborů:
a/ podle systémového údaje o založení/poslední aktualizaci záznamu
wnew, wnew_u - celé nové záznamy (= v daném
období poprvé uloženy do systému)
wakt, wakt_u - celé aktualizované záznamy (=
záznamy aktualizované online i dávkově; může se jednat o jakkoli nepatrnou změnu
v záznamu, např. opravu překlepu; tytéž záznamy se dostanou do souboru wnew i
wakt, pokud jsou během téhož týdne opakovaně aktualizovány)
b/ podle stavového kódu a data v poli 906 ukládaného katalogizátorem
woz, woz_u- záznamy s opravovaným záhlavím - obsahují pole 001
a 200
wzr, wzr_u - zrušené záznamy - obsahují pole 001 a 901 (=číslo
záznamu, k němuž byl zrušený záznam duplicitou)
woc, woc_u - záznamy se změněným identifikačním číslem -
obsahují pole 001 (=nové IČ) , 200 a OPR (=původní IČ); je třeba prověřit výskyt
tohoho IČ ve vlastní autoritní bází a provést ruční opravu
Předběžně počítáme s periodicitou mazání cca 1
měsíc.
3. soubory záznamů nových/aktualizovaných
za příslušný den
(export denně kromě neděle)
Soubory jsou určeny knihovnám Aleph, které si udržují kopii báze - ať již jako záložní v MARC21, nebo jako vlastní bázi v Unimarcu. Soubory obsahují záznamy z celé báze. Soubory jsou označeny datem (např. akt_20020120). Formát je Aleph500 exportní (sekvenční) soubor, UNIMARC/MARC21, diakritika UTF-8. Soubory se ponechávají nejméně 14 dní.
Druhy souborů:
akt_RRRRMMDD (dříve new,cor) -
společně nové a aktualizované záznamy dle systémových údajů - verze Unimarc
akt_RRRRMMDD_m21 - totéž pro MARC21
oz_RRRRMMDD - opravená záhlaví
(=záznamy s polem COR/MOR)
zr_RRRRMMDD - zrušené záznamy
Soubory oz a zr jsou pouze v MARC21 (pole Unimarc jsou totožná nebo podobná a
soubory neslouží k automatickému zpracování, jen k ruční kontrole).
Pro aktualizaci lokálních kopií báze a zároveň
opravu v záhlavích připojených bibliografických bází se používá speciální
program - o poskytnutí programu a další informace je třeba se obrátit na tvůrce
programu
ing.Martina Vojnara.
4. konspekt
Záznamy konspektu nejsou skutečné autority a
jejich stahování přes Z39.50 je problematické, protože obsahují speciální znaky,
které Z39.50 klienty většinou neumějí zpracovat správně. Protože se mění jen
výjimečně, doporučujeme ne-alephovským knihovnám stažení celého souboru a
naimportování záznamů do lokální báze autorit.
K dispozici jsou následující soubory:
1/ řádkový marc:
utf-8: konsp_uni.ed, konsp_m21.ed
cp-1250: konsp_uniw.ed, konsp_m21w.ed
2/ podle ISO 2709:
utf-8: konsp_uni.iso, konsp_m21.iso
cp-1250: konsp_uniw.iso, konsp_m21w.iso
3/ aleph sekvenční formát - utf-8:
konsp_uni.dat, konsp_m21.dat
Změny v záznamech konspektu budou oznamovány
na stránkách věcných autorit.
Kontakt pro otázky spojené se soubory
vystavovanými na ftp:
Helena Dvořáková