Nacházíte se zde: Úvod O knihovně Odborné činnosti Zpracování fondů Archiv Soubory na ftp severu v adresáři

Soubory na ftp severu v adresáři

 

 

Soubory na ftp serveru v adresáři autorit, určené ke stahování

(Aktualizace informací 20.3.2006)

Soubory se nacházejí na ftp.nkp.cz v adresáři au/download. Jsou k dispozici všem účastníkům kooperačního projektu, dle dohody dalším zájemcům. Jedná se o autority jmenné i věcné (aktualizace jsou ve společném souboru).

O přidělení loginu pro přístup na ftp je třeba požádat dr.Zdeňka Bartla.
Potřebné informace - sigla knihovny, heslo (nejméně 6 znaků; pokud již má knihovna heslo pro zasílání záznamů do souborného katalogu, může požádat o používání téhož).
 

1. export celé báze / jednotlivých typů autorit + kumulované změnové soubory

Pro knihovny Aleph se vytváří výjimečně na požádání export celé báze ve variantě MARC21 - autvse.m21, a variantě Unimarc - autvse.uni.

Pro ostatní knihovny se cca 2x ročně nebo na požádání vytvářejí soubory podle druhu autority - aut_jmen, aut_vec - s příslušnými příponami.
Formát je řádkový UNIMARC, kódování CP-1250 (win) nebo UTF-8 (utf). Soubory obsahuji všechny platné autority k příslušnému datu.
Před stažením doporučujeme zkontrolovat datum a dle potřeby doplnit aktualizovanými záznamy (viz 2).

Kumulované změnové soubory jsou pouze ve variantě řádkový unimarc, v kódování CP-1250 (win) a UTF-8 (utf). Pořizujeme celkové kumulace a kumulace za uplynulý rok.
Jména souborů:
auj_oz, auj_zr,auj_oc, auv_oz,auv_zr, auv_oc - s příslušnými příponami
(odpovídají konvenci dle bodu 2).
 

2. soubory záznamů nových/aktualizovaných autorit za poslední týden
(export každou sobotu)

Soubory jsou určeny knihovnám s jinými systémy než Aleph používající dosud Unimarc, které si chtějí aktualizovat své vlastní lokální báze autorit a/nebo opravit záhlaví ve svých bibliografických bázích. Počítá se s vazbou na identifikační číslo autority, které se až na zcela výjimečné případy nemění (identifikační čísla, která bylo nutno změnit, většinou z důvodů duplicity způsobené lidskou chybou, jsou potom obsažena ve zvláštním souboru). Soubory začínají w (=weekly) a jsou označeny pořadovým číslem týdne (např. wakt_49, wakt_u_49).

Formát je řádkový UNIMARC.
Standardní soubory jsou v kódování CP-1250. Pro zájemce pracující v UTF-8 jsou od dubna 2005 k dispozici soubory v originálním kódování UTF-8, které obsahují pro odlišení ve jménu souboru _u před číslem týdne.

Druhy souborů:
a/ podle systémového údaje o založení/poslední aktualizaci záznamu
wnew, wnew_u - celé nové záznamy (= v daném období poprvé uloženy do systému)
wakt, wakt_u - celé aktualizované záznamy (= záznamy aktualizované online i dávkově; může se jednat o jakkoli nepatrnou změnu v záznamu, např. opravu překlepu; tytéž záznamy se dostanou do souboru wnew i wakt, pokud jsou během téhož týdne opakovaně aktualizovány)
b/ podle stavového kódu a data v poli 906 ukládaného katalogizátorem
woz, woz_u- záznamy s opravovaným záhlavím - obsahují pole 001 a 200
wzr, wzr_u - zrušené záznamy - obsahují pole 001 a 901 (=číslo záznamu, k němuž byl zrušený záznam duplicitou)
woc, woc_u - záznamy se změněným identifikačním číslem - obsahují pole 001 (=nové IČ) , 200 a OPR (=původní IČ); je třeba prověřit výskyt tohoho IČ ve vlastní autoritní bází a provést ruční opravu

Předběžně počítáme s periodicitou mazání cca 1 měsíc.
 

3. soubory záznamů nových/aktualizovaných za příslušný den
(export denně kromě neděle)

Soubory jsou určeny knihovnám Aleph, které si udržují kopii báze - ať již jako záložní v MARC21, nebo jako vlastní bázi v Unimarcu. Soubory obsahují záznamy z celé báze. Soubory jsou označeny datem (např. akt_20020120). Formát je Aleph500 exportní (sekvenční) soubor, UNIMARC/MARC21, diakritika UTF-8. Soubory se ponechávají nejméně 14 dní.

Druhy souborů:

akt_RRRRMMDD (dříve new,cor) - společně nové a aktualizované záznamy dle systémových údajů - verze Unimarc
akt_RRRRMMDD_m21 - totéž pro MARC21

oz_RRRRMMDD - opravená záhlaví (=záznamy s polem COR/MOR)
zr_RRRRMMDD - zrušené záznamy
Soubory oz a zr jsou pouze v MARC21 (pole Unimarc jsou totožná nebo podobná a soubory neslouží k automatickému zpracování, jen k ruční kontrole). 

Pro aktualizaci lokálních kopií báze a zároveň opravu v záhlavích připojených bibliografických bází se používá speciální program - o poskytnutí programu a další informace je třeba se obrátit na tvůrce programu ing.Martina Vojnara.
 

4. konspekt

Záznamy konspektu nejsou skutečné autority a jejich stahování přes Z39.50 je problematické, protože obsahují speciální znaky, které Z39.50 klienty většinou neumějí zpracovat správně. Protože se mění jen výjimečně, doporučujeme ne-alephovským knihovnám stažení celého souboru a naimportování záznamů do lokální báze autorit.

K dispozici jsou následující soubory:
1/ řádkový marc:
utf-8: konsp_uni.ed, konsp_m21.ed
cp-1250: konsp_uniw.ed, konsp_m21w.ed
2/ podle ISO 2709:
utf-8: konsp_uni.iso, konsp_m21.iso
cp-1250: konsp_uniw.iso, konsp_m21w.iso
3/ aleph sekvenční formát - utf-8:
konsp_uni.dat, konsp_m21.dat

Změny v záznamech konspektu budou oznamovány na stránkách věcných autorit.
 

Kontakt pro otázky spojené se soubory vystavovanými na ftp:
Helena Dvořáková 

Z. Bartl