[올보카제작과정]
#1.빅데이터를활용하여어휘의우선순위를계산했다.
130억영문텍스트속파생어및관련어휘를표제어와통합하는작업을거쳤고,통합빈도수를기준으로표제어를정렬했다.또한,주요파생어들은교재속표제어와함께표시하였다.
#2.특이사례들은순위를조정하였다.
예를들어,초급어휘인‘Giraffe(기린)’는단순빈도수기준으로는최고난도어휘로분류된다.유아용교재엔자주등장하지만그외의텍스트엔매우드물게등장하는단어이기때문이다.올보카는해당어휘를초급어휘에해당되도록순위를조정하는등,난이도최적화작업을진행하였다.
#3.외래어는별도학습이가능하도록필터링하였다.
우리나라에서유난히많은외래어가사용되는만큼,상당수어휘는철자만익히면단번에체득가능하다.예를들어Lingerie(란제리),Veranda(베란다),Bourgeois(부르주아)등의어휘는얼핏보면생소하지만발음과스펠링만익히면손쉽게외워진다.
#4.일반학습자입장에서불필요한특수용어들을배제하였다.
일례로‘Paraffin’이란단어는‘CnH2n+2의화학식으로표현되는알케인탄화수소(등유)를두루일컫는표현’인데,빈도수로는순위권에들지만일반적인학습자에게기대되는어휘가아니다.또한,GooglenGram을활용해불필요한고어들도제거하였다.
#5.교육부지정필수영단어들은우선순위산정시가중치를부여했다.
교육부가공개한필수영단어리스트는영어학습의기초가되는어휘들을담고있다.해당어휘들에가중치를부여함과동시에교재내에서교육부지정단어임을표시하였다.이는올보카를우리나라영어학습환경에최적화하기위한작업이었던만큼남녀노소누구나올보카로평생학습이가능하다.