Αρχική > Unfiled > The Semantics ‘r’ us (Μέρος 2)

The Semantics ‘r’ us (Μέρος 2)

Σεπτεμβρίου 2, 2006 Σχολιάστε Go to comments

Το μεγαλύτερο πρόβλημα που αντιμετωπίζει ο παγκόσμιος ιστός αυτή τη στιγμή είναι και το μεγαλύτερο του πλεονέκτημα: Η πολυγλωσσία του. Ακόμα και ο σημασιολογικός ιστός όπως τον έχει οραματιστεί ο Tim Berners-Lee ακόυγεται και γράφεται ως «Semantic Web» ή «Web2.0». Δύο διαφορετικές λέξεις για το ίδιο πράγμα!

Το πρόβλημα εντοπίζεται σε δυο βασικούς άξονες. Πολλές λέξεις να περιγράφουν το ίδιο αντικείμενο (πολυσημία) και μια λέξη να περιγράφει διαφορετικά πράγματα (αμφισημία). Το μεγάλο αυτό ζήτημα έρχεται να καλύψει η οντολογία. Μια τυποποιημένη περιγραφή ενός συγκεκριμένου τομέα γνώσης η οποία πρέπει (;) να είναι αποδεκτή απο τουλάχιστον δυο άτομα, ώστε να έχει νόημα η ύπαρξή της.

Μια οντολογία περιγράφει επ’ ακριβώς τις έννοιες που αποφασίζει η ομάδα να περιγράψει. Σίγουρα το πιο δύσκολο μέρος της ανάπτυξης μιας οντολογίας είναι οι παραδοχές που πρέπει να πάρεις για το ποιες έννοιες θα περιγράψεις και ποιες έννοιες θα αφήσεις έξω (δεν μπορείς να περιγράψεις τα πάντα). Η επιτυχία των οντολογιών βασίζεται στο οτι δανείζονται χαρακτηριστικά απο την αντικειμενοστραφή μοντελοποίηση των πληροφοριών.

Το W3 Consortium «αποφάσισε» να «αποδεχθεί» την γλώσσα ανάπτυξης OWL ως το «επίσημο» εργαλείο δημιουργίας οντολογιών. Η αλήθεια είναι πως η OWL συνδυάζει με επιτυχία την απλότητα (στην ανάπτυξη) με την πολυπλοκότητα (στη σχεδίαση) αφού με την προσθήκη των Description Logics, μιας μαθηματικής τεχνικής που βοηθάει στην «έμμεση» περιγραφή πολύ σημαντικών πληροφοριών-δεσμεύσεων (π.χ. σε μια οντολογία που περιγράφει ένα ανθρώπινο μητρώο ποτέ δε θα μπορεί να υπάρξει «Μητέρα» χωρίς τουλάχιστον έναν «απόγωνο»), δίνει την δυνατότητα στην οντολογία (με τη χρήση κατάλληλων «οδηγών») να μπορεί να επιστρέψει implied knowledge σε ερωτήσεις (queries) με explicit data.

Μερικές σημαντικές προσπάθειες που έχουν γίνει όσον αφορά την ανάπτυξη οντολογιών είναι οι παρακάτω:

  • Wordnet (http://wordnet.princeton.edu/): Μια πάρα πολύ σημαντική προσπάθεια μοντελοποίησης της αγγλικής γλώσσας σε μια οντολογία που επιτρέπει την αναζήτηση όρων, εννοιών, σημασιών, συνωνύμων, αντίθετων, κλπ.
  • SUMO (http://ontology.teknowledge.com/) (Suggested Upper Merged Ontology) Μια προσπάθεια ενοποίησης βασικών οντολογιών με σκοπό τη δημιουργία μιας ενιαίας οντολογίας που θα περιγράφει πολύ βασικές έννοιες του πραγματικού κόσμου (π.χ. «γεγονός», «χρόνος», κλπ).
  • Cyc (http://www.cyc.com/cyc/technology/whatiscyc): Μια προσπάθεια αντίστοιχη του SUMO που μοντελοποιεί πολύ βασικές πληροφορίες του πραγματικού κόσμου και σκοπό έχει να αποτελέσει το υπόβαθρο για τη δημιουργία άλλων πολυπλοκότερων γνωσιακών μοντέλων.
  • CIDOC-CRM (http://cidoc.ics.forth.gr/): Με την Ελλάδα και το πανεπιστήμιο της Κρήτης να έχει αναλάβει έναν πολύ ενεργό ρόλο στην ανάπτυξη αυτού του έργου που σκοπός του είναι να βοηθήσει στην περιγράφεί-μοντελοποίηση της πληροφορίας που βρίσκεται σε μουσειακές συλλογές. Το CIDOC-CRM έγινε πρόσφατα και ISO standard.
  • FRBR (http://www.ifla.org/VII/s13/frbr/frbr.htm) (Functional Requirements for Bibliographic Records): Αντίστοιχο του CIDOC-CRM άλλα αφορά στην προσπάθεια μοντελοποίησης βιβλιογραφικών πληροφοριών.
  • Open Directory Project (http://www.dmoz.org/): Μια προσπάθεια δημιουργίας καταλόγου τύπου «yahoo» με την βοήθεια χρηστών-εθελοντών. Δηλαδή τις κατηγορίες και την κατηγοριοποίηση την κάνουν άπλοι άνθρωποι (συνήθως κάποιοι ερευνητές) και όχι συγκεκριμένοι «επαγγελματίες», όπως στη Yahoo για παράδειγμα. URLs μπορεί να προσθέσει ο καθένας.

Αυτές οι προσπάθειες είναι μόνο ένα πολύ μικρό κομμάτι του τι έχει συμβεί μέχρι τώρα. Παραμένουν όμως απλά standards και η χρήση τους δυστυχώς αναζητείται μόνο σε συγκεκριμένα ερευνητικά έργα αφού η γενικότερη δυσκολία στην αφομοίωση τους δεν επιτρέπει τη χρήση τους απο την κρίσημη μάζα των χρηστών. Βέβαια οφείλω να αναφέρω οτι δεν έχει υπάρξει ακόμα κάποια σοβαρή προσπάθεια στην γλωσσική ενοποίηση σημαντικών εννοιών. Τα αγγλικά σίγουρα βοηθάνε πολύ, άλλα μόνο τους λίγους.

(σύντομα η συνέχεια…)

Advertisements
Κατηγορίες:Unfiled
  1. Δεν υπάρχουν σχόλια.
  1. No trackbacks yet.

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s

Αρέσει σε %d bloggers: