Jako, że jestem regularnie co kilka tygodni pytany jak tworzy się bazy słownikowe dla programu Xlator postanowiłem możliwie przejrzyście spisać instrukcję krok po kroku.
1. Na początek potrzebne są nam dane – jest to słownik, więc niezbędne wydaje się posiadanie dwóch kategorii danych: termin + definicja. Użyjmy więc arkusza kalkulacyjnego i stwórzmy sobie następujący plik, w tym przypadku jest to fragment słownika francusko-polskiego:
abonprix;à bon prix – tanio
actuellement;actuellement – aktualnie
Jak widać jest to format CSV, rozdzielany średnikami (Excel, nie wiedzieć czemu, nazywa ten format CSV rozdzielany przecinkami). Pierwsza kolumna („abonprix”) to kolumna z terminem, pozbawionym spacji, przecinków, polskich znaków, cyfr, myślników, apostrofów – muszą tam zostać gołe znaki alfabetu łacińskiego. Nic więcej.
Druga kolumna („à bon prix – tanio”) zawiera definicję. Warto powtórzyć w niej wygląd terminu w prawidłowej formie, ze wszystkimi upiększaczami. Długość tej kolumny jest ograniczona, ale nie pamiętam do ilu znaków, chyba 1024, czyli wcale nie mało.
2. Drugi etap to tworzenie bazy danych za pomocą MS Access. Baza musi nazywać się „Dictionary” i zawierać trzy pola:
- TitleXlator
- TextXlator
- Title
Wszystkie pola są standardowego typu tekstowego. Najwygodniej jest najpierw zaimportować wcześniej przygotowany plik tekstowy w formacie CSV, a następnie zmienić nazwy pół, nazwę bazy, skasować indeks (o ile został dodany). Pole „Title” może pozostać puste.
3. Ściągamy program directxv1 autorstwa Luc’a, który bez zbędnego skomplikowania przekonwertuje nam przygotowaną bazę .mdb na xlatorowy plik .xv1
4. W zasadzie na tym etapie można by skończyć zabawę, ale dobrze jest skonwertować plik .xv1 na format .xc2. Potrzebny jest do tego ten konwerter. Składnia programu jest prosta:
konwerter „nazwa” plik_we plik_wy [opcja]
co na przykładzie wygląda następująco:
konwerter „Francusko-Polski” 0 0 /c
Nazwa pliku wejściowego i wyjściowego podawana jest bez rozszerzenie. Pamiętajcie również o jednoznakowej konwencji nazewnictwa słowników.
To tyle.
Sierpień 13th, 2009 at 20:42
CSV – Coma Separated Value
Sierpień 23rd, 2009 at 23:10
1. A nie prościej opublikować specyfikację formatów xv1 oraz xc2?
Chyba łatwiej napisać sobie skrypcik konwertujący txt -> xc2 niż kombinować z jakimś ms accessem (tym bardziej że nie ma go w repozytoriach np.: Debiana)
2. Jakie kodowanie obsługuje xlator? Czy jest to utf-8?
Sierpień 24th, 2009 at 15:39
Oczywiście, że łatwiej,ale nie ja tworzyłem te formaty i powiem szczerze: nie mam ochoty na wgłębianie się w niskopoziomowe programowanie. Powyższy opis jest skierowany do osób, które chciałyby, ale nie potrafią.
Co im pomoże specyfikacja xc2?
Październik 18th, 2009 at 22:06
próbowalem tak zrobić i nie da rady czy możesz wrzucić na stronę jakiś przykładowy plik w bazie access
Październik 19th, 2009 at 8:42
Proszę: http://kasze.ijon.info/wp-content/uploads/przyklad.zip
Październik 19th, 2009 at 21:42
witam ponownie, bardzo dziękuję za plik, mam jednak inny problem, który dotyczy wyświetlania norweskich liter: å æ ø. Jak to zrobić, jakiego kodowania użyć, bowiem w podobne litery w słowniku niemiecko polskim są prawidłowo wyświetlane.
Październik 26th, 2009 at 16:58
czy ktoś mi może pomóc w zrobieniu bazy słownikowej z literami norweskimi???
Październik 26th, 2009 at 18:59
rk: wątpię. z tego co wiem, to xlator nie obsługuje utf8 i kropka.
Październik 26th, 2009 at 21:17
ok dzięki za odpowiedź, pozdrawiam
Listopad 12th, 2009 at 16:42
Ja nie rozumiem jak działa ten konwerter w punkcie 4. Próbuje i nic, nie wyświetla mi się żadna składnia. :s Byłbym wdzięczny za wyjaśnienie.
Listopad 16th, 2009 at 22:22
elo nie potrafie przekonwertowac mozesz to dokladnie rozpisac nawet jak mozesz to zrob film jak ty to robisz albo kontakt na gg 2524930 pozdro
Styczeń 10th, 2010 at 21:49
Mógłby ktoś jeszcze raz wrzucić konwerter z xv1 na xv2 ? Bo sesja się zbliża i przydałby się mały pomocnik… ;p
Styczeń 10th, 2010 at 21:54
http://www.sendspace.pl/file/fe4e21618a5a03bd836a513 – konwerter
Listopad 11th, 2010 at 15:17
A mógłbyś udostępnić te „nadesłane źródła”. Korzystam z tego twojego słownika, jest dobry, ale ma kilka wad. Po pierwsze wyrazy nie są w nim poukładane alfabetycznie, co przy przewijaniu w lewo i w prawo, do innych słówek bywa irytujące, po drugie nie wyświetla „e”, po trzecie ucina listę tłumaczeń niektórych wyrazów (to jest spowodowane najprawodobniej starą wersją konwertera).