특허청은 4. 29.(화)부터 정보서비스 산업 활성화를 위해 인공지능(AI) 학습에 활용 가능한 지식재산 데이터 7종을 특허정보활용서비스(KIPRISplus , plus.kipris.or.kr)를 통해 무료로 개방한다고 밝혔다.
특허정보활용서비스(KIPRISplus)는 특허청이 운영하는 대표적인 지식재산 분야 공공데이터 개방 플랫폼이다. 국내는 물론 미국, 유럽, 일본 등 총 13개국에서 발간된 지식재산권 관련 공보와 특허 행정정보 등 총 133종의 지식재산 데이터를 기업과 연구기관, 대학교 등 다양한 수요자들이 자유롭게 활용할 수 있도록 지원하고 있다.
이번에 개방되는 데이터는 특허청의「2023년 AI기반 특허행정 혁신 사업」 추진 과정에서 구축된 것으로 ▲국내 특허·실용신안 공개공보 ▲미국 특허공보 ▲의견제출·거절결정서 ▲특허 패밀리 한영 기계번역 ▲국제특허분류(CPC) ▲특허상담 기계독해 ▲특허고객 상담사례집이 포함된다.
최근 많은 기업들이 인공지능 성능 향상을 위해 다양한 데이터를 학습시키고 있으며, 이 과정에서 특허 데이터에 대한 수요 또한 꾸준히 증가하고 있다. 하지만, 특허 분야는 복잡한 구조와 전문용어의 특성으로 인해 인공지능 학습에 적합한 데이터를 분석·구축하는 데 막대한 시간과 비용이 소요되어, 관련 기업들은 양질의 학습데이터를 확보하는 데 어려움을 겪고 있는 실정이다.
이에, 특허청은 민간의 학습데이터 구축 부담을 경감하고, 인공지능을 활용한 정보서비스 개발을 지원하기 위해, 지식재산 데이터를 가공한 고품질 학습데이터를 전면 개방하였다.
이번에 개방하는 학습데이터 7종은 특허청의 행정업무 및 민원 처리 과정에서 생성된 특허정보를 인공지능 기술 학습에 적합하도록 가공한 것으로, 관련 기업과 연구기관은 특허문헌 분석서비스, 인공지능 챗봇 등 다양한 인공지능 기술 개발에 바로 활용할 수 있을 것으로 기대된다.
특허청 최일승 산업재산정보국장 직무대리는 “이번 데이터 개방은 지식재산 정보서비스 산업 고도화에 실질적인 밑거름이 될 것”이라며, “앞으로도 다양한 형태의 특허데이터를 지속적으로 구축·개방하여 지식재산 정보 생태계를 더욱 활성화해 나가겠다”고 밝혔다.