# IOB2Corpus **Repository Path**: mario1316/IOB2Corpus ## Basic Information - **Project Name**: IOB2Corpus - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-12-23 - **Last Updated**: 2020-12-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 概要 [hironsan.txt](https://github.com/Hironsan/IOB2Corpus/blob/master/hironsan.txt)は、ウィキニュース日本語版をMeCabで形態素解析してIOB2タグでタグ付けしたコーパスです。 全部で500文にタグ付けしています。 タグ付けの基準はIREXの定義に基づいています。(だいたい) * http://nlp.cs.nyu.edu/irex/NE/df990214.txt ウィキニュース日本語版のライセンスはクリエイティブ・コモンズ-表示-2.5です。 [ja.wikipedia.conll](https://github.com/Hironsan/IOB2Corpus/blob/master/ja.wikipedia.conll)は、Wikipedia日本語版から抽出したテキストをMeCabで形態素解析してタグ付けしたコーパスです。