카카오 제주어 번역 - kakao jejueo beon-yeog

생생정보

사투리 번역기 제주, 구글, 네이버 방언 사전 으로 해결

2022. 4. 6. 08:45

사투리 번역기 제주, 구글, 네이버 방언 사전 으로 해결

우리나라는 그리 넓은 땅덩어리는 아니지만 각 지역별로 산맥으로 나뉘어져 있어 사투리 차이는 다소 심한 편입니다. 특히 외따로 떨어져 있는 제주도는 더욱 언어면에서 이질감을 느끼게 되는 경우가 많은데요. 이런 거리감을 해소하기 위해 사투리 번역기 개발의 필요성이 증대되고 있습니다. 현재 이용 가능한 사투리 번역기에 대해 알아보고자 합니다.

사투리 번역기

네이버 방언 사전

국어사전 상에 주제별 보기란에서 방언을 선택 후 각 지역별 방언을 확인할 수 있습니다. 다만 아직 번역기라고 하기에는 다소 부족하며 사투리 사전에 가까운 기능을 제공하고 있습니다. 대신 간단한 예문 및 뜻, 사용되는 지역 등에 대한 정보는 비교적 자세히 제시하고 있는 것이 특징입니다.

제주 방언 사전

//instablank.com/jeju에 접속해보면 제주방언 번역기 서비스를 제공하고 있는 걸 확인할 수 있습니다. 입력창에 내용을 입력하면 단어를 분석해 방언을 검출하고 이를 표준어로 번역해 주는 형태인데요. 하단 결과란에 제주도 방언으로 검출된 텍스트와 그에 대한 표준어 풀이를 기재해주는 형태입니다.

구글 사투리 번역기

정식 출시된 서비스는 아니며 지난 2008년 만우절 프로젝트로 한국인 사용자만을 위해 구글이 제공했던 기능입니다. 구글코리아에서 자체 개발한 사투리 통계 번역 시스템을 활용한 제품으로 비교적 그럴싸한 제품 설명이 되어 있어 반가워한 사용자가 많았지만, 알고보니 속았다는 반응으로 이어진 에피소드입니다.

사투리 번역기가 아직 정착되지 않은 이유

세계적으로 다양한 국가의 언어가 번역기를 통해 실시간 번역이 되고 있지만 아직 사투리 번역은 더딘 상태입니다. 하지만 AI기술을 이용한 번역기술이 점차 발전하고 있어 온라인 상에서 외국어 번역하듯 쉽게 사투리를 이해할 수 있는 방법은 곧 출시될 가능성이 높아 보입니다.

‘카카오 i 번역’…어학사전 연동 등 다양한 학습 보조기능 추가

카카오 번역 서비스가 기존 6개 언어에서 19개 언어로 확대되고, 어학사전 연동 등 다양한 학습 보조기능이 추가된다.

카카오(공동대표 여민수, 조수용)는 AI(인공지능) 기반 번역 서비스인 ‘카카오 i 번역’을 개편, 언어의 종류를 확장하고 번역 품질을 향상했다고 22일 밝혔다.

우선 번역 가능 언어가 19개 언어로 확장됐다. 종전에는 한국어를 기반으로 중국어, 영어, 일본어, 인도네시아어, 베트남어 등 총 6개 국가 언어 번역을 지원했는데 포르투갈어, 아랍어, 러시아어, 태국어, 이탈리아어, 뱅골어, 말레이시아어, 힌디어, 네덜란드어, 독일어, 터키어, 프랑스어, 스페인어 등 13개 국가 언어를 추가해 총 19개의 언어 번역이 가능해졌다.

이와 함께 문체 설정, 단어 단위 하이라이팅(형광펜 표시), 어학사전 연동 등 다양한 학습 보조 기능을 추가해 사용자의 편의성을 높였다.

문체 설정은 외국어에서 한국어로 번역시 번역 결과물에 예사말과 높임말로 문체를 설정할 수 있는 기능이다.

번역 검색 결과 노출 시 단어 단위로 하이라이팅 기능도 제공한다. 예를 들어 ‘I like an apple’이라는 영어 문장을 ‘나는 사과를 좋아한다’라고 한국어로 번역할 시, ‘apple’과 ‘사과’에 하이라이팅이 적용돼 단어 매칭이 가능하다.

아울러 다음 어학사전과 연동해 학습 기능을 강화했다. 번역 결과에서 특정 단어를 더블 클릭 하거나 드래그 할 경우 단어의 정의와 관련 예문을 함께 보여준다. 하단의 단어를 바로 클릭하거나 단어 옆에 함께 표기되는 화살표 모양의 버튼을 클릭하면 다음 사전 페이지로 이동해 관련어, 문법 등 추가 정보를 확인할 수 있다.

카카오는 2017년 9월부터 카카오 i의 번역 엔진을 적용한 기계 번역 서비스 ‘카카오 i 번역’(Beta)을 서비스 중이다. 다음 검색창에 번역, 카카오 i 번역, 번역기 등을 검색하거나 카카오톡에서 카카오i 번역 플러스친구를 추가해 이용할 수 있다.

    • 가나다라마바사
    • 가나다라마바사
    • 가나다라마바사
    • 가나다라마바사
    • 가나다라마바사
    • 가나다라마바사

저작권자 © 제주일보 무단전재 및 재배포 금지

계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

IT

사라져 가는 제주어 AI로 살린다

김시소 입력 2020. 3. 19. 14:43 수정 2020. 3. 19. 17:06

자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

카카오가 인공지능(AI)을 활용한 '제주어' 번역을 선보였다.

카카오는 'AI 제주어 번역기'가 사멸언어 보존 연구와 관심 환기에 도움을 줄 수 있다고 설명했다.

카카오 관계자는 "녹음, 구술 자료집 편찬, 제주어 교육, 연구 및 사전 편찬과 같은 활동뿐만 아니라 AI 학습 데이터셋이나 번역 모델 및 음성합성 모델도 언어 보존 활동의 일환이라고 볼 수 있다"고 설명했다.

글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

  • 매우 작은 폰트
  • 작은 폰트
  • 보통 폰트
  • 큰 폰트
  • 매우 큰 폰트

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카카오가 인공지능(AI)을 활용한 '제주어' 번역을 선보였다. 사멸언어 보존은 물론 AI를 활용한 연구 기반을 마련했다. 김범수 카카오 의장이 카카오톡 출시 10주년을 맞아 임직원에게 제시한 “사회문제 해결의 주체가 될 것”이란 주문과 일맥상통한다.

카카오는 제주어 기계번역·음성합성 모델을 확보했다고 19일 밝혔다. 관련 개발을 담당한 카카오브레인 연구팀은 국제공인자동번역률평가(LREC)로부터 '기계번역과 음성합성을 위한 제주어데이터셋(박규병, 최요중, 함지연)' 논문 게재 승인을 받았다. 카카오는 “제주어를 전산학으로 접근한 최초의 연구 성과를 인정 받았다”고 밝혔다.

제주어는 한국 방언 또는 한국어족에 속한 언어 가운데 하나다. 언어학 가치가 높지만 보존이 어려운 상황이다. 1950년대 이전에 태어난 70세 이상 고령층 1만명 정도만 제주어를 자유자재로 구사하고 있을 뿐이다. 유네스코는 지난 2011년에 제주어를 소멸위기언어 4단계인 '심각 단계'로 분류했다. 소멸 직전 단계로 평가한 것이다.

카카오브레인 연구팀은 AI가 제주어를 구현하도록 △제주어 학습 데이터셋 △딥러닝 기계번역 모델 △딥러닝 음성합성 모델을 구축했다. AI가 제주어를 학습하고 발화할 수 있다. 영원히 사라지지 않는 '제주어 능통 구사자'가 탄생한 것이다.

연구팀은 기계학습에 필요한 데이터셋의 자체 확보에 주력했다. 제주어 번역 모델 훈련에 적합한 형태 텍스트 데이터는 물론 잡음이 섞이지 않은 음성 데이터를 보유한 기관이 없기 때문이다.

카카오브레인은 제주학연구센터가 만든 '제주어구술자료집' 2017년과 2018년 버전을 가공, '제주어 문장, 한국어 문장'으로 구성된 17만개 병렬 말뭉치 '제주어구술기록집'(JIT)을 만들었다. 제주 출신 30대 아마추어 성우를 섭외, 약 14시간 동안 녹음해서 '제주어1인구술자료'(JSS)를 확보했다.

JIT와 JSS를 통해 제주어를 학습하고 스스로 발화하는 AI 모델을 구현했다. 카카오브레인은 JIT와 JSS 두 가지 데이터셋을 오픈소스 형태로 공개, 누구나 무료로 활용하게 할 방침이다.

카카오는 'AI 제주어 번역기'가 사멸언어 보존 연구와 관심 환기에 도움을 줄 수 있다고 설명했다. 카카오 관계자는 “전산학 관점에서 제주어 번역기 또는 통역기를 만든 최초 시도”라면서 “사멸 위기에 처한 제주어에 대한 관심을 불러일으키는 계기가 됐으면 하는 바람”이라고 강조했다.

보존 활동 패러다임 변화도 기대된다. 카카오 관계자는 “녹음, 구술 자료집 편찬, 제주어 교육, 연구 및 사전 편찬과 같은 활동뿐만 아니라 AI 학습 데이터셋이나 번역 모델 및 음성합성 모델도 언어 보존 활동의 일환이라고 볼 수 있다”고 설명했다.

후속 연구 방향은 열어 놨다. 필요하다면 관련 기관과 협업할 계획이다. 박규병 카카오브레인 연구원은 “이번 연구가 국내외 학자가 제주어에 대한 관심을 지속해서 기울이는 계기가 됐으면 한다”면서 “제주어를 전산학으로 접근하는 데 산·학 협력과 지방자치단체 차원의 지원이 활발해지길 바란다”고 말했다.

카카오프렌즈, 프렌즈 인 제주 제품. 사진=카카오

김시소기자

Copyright ⓒ 전자신문 & 전자신문인터넷, 무단전재 및 재배포 금지

전자신문에서 직접 확인하세요. 해당 언론사로 이동합니다.

  • 한국IBM, 프라이빗부터 퍼블릭까지..클라우드 공략 강화한다
  • 신동빈, 日 롯데홀딩스 회장 선임..한·일 경영권 완전 장악
  • 中 반입 '난항'..韓 디스플레이 장비 업계 '난감'
  • [단독]국세청, 한미약품 세무조사 착수..5년만에 조사, 업계도 촉각
  • LG V60 씽큐, 일본 138만원vs미국 98만원.. 지역 맞춤 전략
  • 교원단체 "그동안 축적한 모든 자료 무료로 공유, 양방향 소통 강화"
  • "수출 부진에 코로나19까지"..로봇 및 부품기업들 사업 순연 잇따라
  • 정부 R&D, 표준 연계 강화..국표원, 기술성숙도별 표준 유형 분석
  • 미래한국당 비례대표 명단, 투표서 '부결'..재수정 불가피
  • "재택근무.아이돌봄 무료 제공"..코로나 극복에 '착한 스타트업' 뜬다

Toplist

최신 우편물

태그