Foto: http://www.asmedia.ru«Орос хэлний үндэсний корпус» нэртэй энэ системийн цахим хаяг нь www.ruslang.ru. Энэ систем юуны өмнө бүх төрлийн уран сайхны бүтээл төдийгүй, 19-21-р зууны үеийн орос хэлээр бичсэн бусад эх сурвалжийг багтааснаараа интернетийн өдий төдий номын сангаас өөр юм. Энэ нь хүүрнэл зохиол, яруу найраг, жүжгийн зохиол, дуртгал, баримт бичиг, нийтлэл, эрдэм шинжилгээний болон шашны зохиол, өдрийн тэмдэглэл, хувийн захиа сэлт юм. «Үндэсний корпус» байгуулахад голлон оролцсон Москвагийн орос хэлний хүрээлэнгийн захирал, Оросын ШУА-ийн сурвалжлагч гишүүн Александр Молдован ярихдаа:
- Үүнд багтсан бүх текст, үг бүр нэмэлт тайлбартай. Түүнийг үг бүрт «хадсан» гэмээр. Энэ нь юуны өмнө хэл зүйн мэдээлэл. Үг бүр буюу үгийн хэлбэрийг лавлагаажуулсан. Жишээ нь, нэрлэхийн тийн ялгалд, ганц тоогоор байгаа нэр үг гэх мэтээр. Бас ямар үгийг хаанаас авсан, түүнийг хэзээ бичсэн. зохиогч нь хаа аж төрж байсан, төрөл, бүр агуулга нь юу болох тухай нэмэлт мэдээлэл бий. Эдгээр нь үндэсний корпусаас маш нарийн, гүнзгий мэдээлэл олж авах боломж олгож байна.
- Дэлхийн ихэнх том хэл Интернетэд өөрийн үндэсний корпустай. Нийтээр зөвшөөрсөн үлгэр нь Британийн үндэсний корпус. АНУ, Герман, Итали, Испани, славян хэлээр ярьдаг бусад оронд ийм систем бий. Тэгэхдээ орос хэл, уран зохиолоор баялаг нь дэлхий нийтэд тодорхой. Оросын үндэсний корпус дахь нийт текст дотор уран зохиол 40 хувь эзэлдэг, тэгвэл бусад үндэсний корпуст хоёр дахин бага байдгийг Орос хэлний хүрээлэнгийн захирал Александр Молдован тэмдэглэлээ. Орос системийн гол онцлогийг тэр онцлон тэмдэглэв.
- Манай корпус дэлхийд буй системүүдээс түрүүлж буй, учир нь бүр 10 үгтэй урт текстээс эрж хайх боломжтой. Ингэхдээ та эрлээ хийхийг хүссэн тэр текстийн аль ч параметрийг үгүүдийн хоорондох янз бүрийн зайд тавьж болно. Жишээ нь, аль нэг үг 19-р зуунд дуртгалын зохиолд таарч байсан эсэхийг та сонирхлоо гэж бодъё. Та бусад бүх текст – 20-р зуун, уран зохиол, эрдэм шинжилгээний зохиол мэтийг хасна. Тийм нөхцөлд таны сонирхсон зүйл гарч ирэх зэрэгцээ дэд корпусыг олно.
- «Орос хэлний үндэсний корпус» нь толь юмуу хэл зүйн гарын авлага шиг зүйл. Гэхдээ энэ нь аль нэг үгийг зөв бичсэн буюу хэрэглэснийг шалгадаг нормативын лавлах биш ээ. «Корпус» нь уран зохиолоос гадна хувийн захиаг ч, сонины нийтлэлийг ч, дуртгалыг ч багтаах учир энд үгийг ганц удаа хэрэглэсэн, заримдаа хошигносон, эсвэл бүр бичгийн мэдлэг тааруу хэрэглэсэн тохиолдол ч бий.
Бүтээж буй лавлахын маягийг тодорхойлбол орос хэлний баялаг, үндэсний өнгө аясыг бүтээж буй орос хэлний маш олон янзын үгийн цуглуулга юм. Ингэснээрээ бүр ч сонирхолтой. Гэхдээ орос хэлэнд байдаг бүх үг «Үндэсний корпуст» орно гэж бодож болохгүй гэж Александр Молдован ярьж байна.
- «Корпус» орос хэлний бүх текстийг багтаахгүй, энэ нь боломжүй зүйл, тусгайлан сонгож авсан текстийг багтаана. Тэдгээр нь түүнд багтдаг нэгж: төрөл, агуулгын хувьд тэнцвэртэй байх ёстой. Учир нь хэл нь төрөл бүрийн маяг, төрлийг багтаадаг. Хэлийг түүхийн тодорхой орчинд зөвөөр байрлуулахын тулд бид эрдэм шинжилгээ, уран зохиол, сурах бичгээс аваад сонины текст, кактусыг хэрхэн арчлах заавар хүртэлх тэр үеийн бүх маягийн текстийг төлөөлег ёстой. Тэгсэн цагт л бид аль нэг үеийн хэлний үнэн зөв үлгэрийг гаргаж чадна.
- Мэдээллийн шинэ системийн тусламжтайгаар орос хэлийг зайнаас сургаж, цахим гарын авлага бүтээж болно. «Корпус» нь шинэ үеийн академик толь, хэл зүй зохиох орчин үеийн орос хэл судлалын тулгамдсан нэг зорилтыг шинэ маягаар шийдэх боломж олгож байна.

Орчуулагч П. Шагдар