Сөздік қордың сәйкес келмеуі - Vocabulary mismatch - Wikipedia

Сөздік қордың сәйкес келмеуі әр түрлі адамдар бір затты немесе ұғымды басқаша атағанда пайда болатын табиғи тілдерді қолданудағы жалпы құбылыс.

Фурнас және басқалар. (1987) сөздік қордың сәйкес келмеу мәселесін сандық тұрғыдан алғаш зерттеген шығар.[1] Олардың нәтижелері көрсеткендей, орта есеппен 80% әр түрлі адамдар (бір саланың мамандары) бір затты басқаша атайды. Әдетте бір нәрсеге жатқызуға болатын ондаған мүмкін есімдер бар. Бұл зерттеу жұмысты ынталандырды жасырын семантикалық индекстеу.

Пайдаланушы жасаған сұраулар мен корпустағы тиісті құжаттар арасындағы сөздік сәйкес келмеуі сәйкессіздік терминін тудырады ақпаратты іздеу. Чжао мен Каллан (2010)[2] сөздік қордың сәйкес келмеу мәселесін сандық тұрғыдан бірінші болып іздеу жағдайында зерттегендер болды. Олардың нәтижелері көрсеткендей, сұраныстың орташа мерзімі қолданушының сұранысына сәйкес келетін құжаттардың 30-40% -ында пайда болмайды. Сондай-ақ, олар сәйкессіздік ықтималдығы негізгі ықтималдықты іздеу модельдерінің бірі - Екілік тәуелсіздік моделі. Олар салмақты болжаудың жаңа терминдерін әзірледі, бұл мықты кілт сөздерді іздеу модельдеріне қарағанда 50-80% дәлдікке ие болады. Осы бағыт бойынша әрі қарайғы зерттеулер көрсеткендей, сарапшылар пайдаланушылардың Boolean Conjunctive Normal Form кеңейтуін кеңейтілмеген кілт сөздік сұраулар бойынша іздеу өнімділігін 50-300% жақсарту үшін қолдана алады.[3]

Сәйкессіздікті шешетін әдістер

Әдебиеттер тізімі

  1. ^ Фурнас, Г., және басқалар, Адам-жүйелік коммуникациядағы сөздік мәселесі, ACM байланыстары, 1987, 30 (11), 964-971 б.
  2. ^ Чжао, Л. және Каллан, Дж., Мерзімді қажеттілікті болжау, 19 ACM ақпарат және білімді басқару конференциясының материалдары (CIKM 2010). Торонто, Канада, 2010 ж.
  3. ^ а б Чжао, Л. және Каллан, Дж., Сұранысты кеңейту үшін автоматты түрде сәйкессіздік диагностикасы, SIGIR 2012.