söndag 25 november 2007

Synonymordbok version 0.1

Här är en första testversion av synonymordboken. Än så länge är så är listan inte särskilt strukturerad. När du slår upp ett ord i synonymordboken så kommer du att få en lista med synonymer. Dessa är sorterade efter hur hög ranking de fått i Synlex. Senare kommer orden underdelas efter betydelse men det kommer nog att dröja ett tag. Jag har ännu inte beslutat mig för hur jag kommer lägga upp projektet och hur stort jag vill göra det.

Här är i alla fall ett första utdrag...

[Ladda ner]

Det finns ännu ingen enkel installation men jag hoppas att ni lyckas med hjälp av informationen som finns i info.txt.

Lycka till.

söndag 11 november 2007

Uppdatering om vad som händer

Hej.

Nu är det två veckor sedan jag bloggade senast så jag känner att det är dags för en uppdatering. Sedan jag senast bloggade har jag arbetat på att förse OpenOffice.org med en liten synonymordbok. Jag har utgått ifrån den fria synonymordlistan Folkets synonymlexikon Synlex.
Importerade xml-filen i Calc och sparade den som ett Calc-dokument. Sedan har jag med hjälp av lite makron strukturerat om ordboken så att varje unikt ord har en egen rad där ordet står i A-kolumnen och dess synonymer i följande kolumner.
När detta var gjort stavningskontrollerade jag filen med den inbyggda stavningskontrollen och diverse ordböcker. Det blev ganska många ord att lägga till i den inbyggda ordboken så där finns en hel del att hjälpa till med vid ett senare tillfälle.

När Calc-filen var färdigkontrollerad skapade jag en databas av filen. Jag skapade en MySQL-databas och anslöt sedan Base till den. När jag anslutit Base kopierade jag helt enkelt innehållet i tabellen till databasen

  1. markera innehållet i Calc-dokumentet
  2. kopiera (Ctrl + C)
  3. öppna databasen
  4. gå till tabeller
  5. klistra in (Ctrl + V)
  6. följ guiden
Sedan skrev jag ett PHP-skript som skrev ut orden med det format som jag ville ha:

ord|antal betydelser(en siffra)
ordklass på första betydelsen|synonym1|synomym2|synonym3 osv.
ordklass på andra betydelsen|synonym1|synomym2...

ett exempel kan se ut så här

exempel|1
(adv)|exempelvis|såsom

Om du vill kan du utelämna ordklassen.

Sedan har jag kopierat in texten i ett vanligt textdokument och döpt den med ändelsen ".dat" skrivit in den textkodning som använts. Slutligen har jag kört ett Perlscript, som distribueras med programmet MyThes-1.0, på dat-filen.

Jag har ännu inte testat programmet MyThes-1.0 eftersom jag inte lyckats installera programmet under Windows. Av vissa skäl som jag inte ska diskutera nu har jag valt bort att installera ett andra operativsystem liksom virtuella versioner av andra operativsystem. Jag vill dock påpeka att bland annat Ubuntu är ett grymt operativsystem som jag med största sannolikhet kommer att köra igen i framtiden.

Jag kommer inom kort att släppa en betaversion av synonymordboken. I betaversionen kommer synonymerna inte att vara uppdelade efter betydelse, inga ordklasser kommer heller att specificeras, men synonymerna kommer att fungera... ;-)

Vi får väl se om detta är till hjälp för någon... Tillsvidare kommer jag att strukturera om databasen lite för att göra en utökning av synonymordboken enklare.