WEKO3
アイテム
{"_buckets": {"deposit": "4522d634-1b66-40dd-adcb-c7bb777d1b8f"}, "_deposit": {"id": "2000462", "owners": [1], "pid": {"revision_id": 0, "type": "depid", "value": "2000462"}, "status": "published"}, "_oai": {"id": "oai:niigata-u.repo.nii.ac.jp:02000462", "sets": ["455", "562"]}, "author_link": [], "control_number": "2000462", "item_6_date_granted_51": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2021-09-21"}]}, "item_6_degree_grantor_49": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_language": "ja", "subitem_degreegrantor_name": "新潟大学"}, {"subitem_degreegrantor_language": "en", "subitem_degreegrantor_name": "Niigata University"}], "subitem_degreegrantor_identifier": [{"subitem_degreegrantor_identifier_name": "13101", "subitem_degreegrantor_identifier_scheme": "kakenhi"}]}]}, "item_6_degree_name_48": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "博士(医学)", "subitem_degreename_language": "ja"}]}, "item_6_description_4": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "【緒言】筋萎縮性側索硬化症(Amyotrophic lateral sclerosis : ALS)の原因遺伝子は30種類以上が知られている。しかし、大家系が少なくなる一方、エクソーム解析で遺伝子多型が多数同定され、これらの病的意義を検討するのが困難となっている。遺伝子多型を認める遺伝子の中から、ALSの原因としての候補遺伝子を効率よく抽出し、病的意義を解析することが求められている。テキストマイニングは、テキスト情報から、類似する性質の単語を抽出する方法である。近年、IBM社の人工知能Watsonを用い、テキストマイニングによりALSの原因候補遺伝子の抽出が行われた。しかし、得られた候補遺伝子に対して、当該遺伝子に変異を持つ例は見出されておらず、その意義は不明である。著者はオープンソースのテキストマイニングであるword2vec/fastTextを用いALSの原因候補遺伝子の抽出を試み、それらの遺伝子の変異の有無をALS剖検例で検討し、その意義を検証した。【方法】word2vecおよびfastTextを用いて2000年から2019年にPubMed上に公開された英語論文163948報の抄録を解析した。ALSの原因遺伝子の約3割はRNA結合蛋白質(RNA binding protein : RBP)である。よって、1164個のRBP遺伝子を、既知の11種類のALS原因RBP遺伝子との類似度(テキストマイニングにおけるcos類似度)が高い順に順位付けし 、ALS原因遺伝子の候補順とした。上位10%をCST10%遺伝子(cosine similarity top10% gene)と命名した。また、既報のメタアナライシスデータより、ALSと非神経疾患ないし一般人集団コントロール群の間で、Rare damaging variant(RDV)の出現頻度が、コントロールに比してALS群に有意に多い遺伝子をALS-RVgと定義した。本法の正当性を、CST10%遺伝子の中で1) ALS-RVgの頻度、2) アノテーションに用いられたGene ontology(GO)termの解析、3) アミノ酸配列から予測した天然変性領域とcos類似度の順位との関連の検討を行った。さらにCST10%遺伝子のうちALS-RVgを新規ALS原因候補遺伝子とし、病理診断ALS108症例でRDVを検索した。【結果】2012年度までのテキストデータを用いた解析で、word2vecではcos類似度上位10%内に、2013年以降に同定された原因遺伝子が含まれた。word2vecでは、CST10%遺伝子群はそれ以外の遺伝子群と比して、ALS-RVgが有意に多かった(word2vec: p = 0.0044, fastText: pp = 0.073)。しかし、多重検定補正後の、q値 0.05未満の遺伝子はなかった。またGO解析では、CST10%遺伝子は、スプライシングに関係する遺伝子が多かった。cos類似度上位上位の遺伝子群は下位の遺伝子群と比べて、天然変性領域の占める割合が大きい傾向にあった(word2vec: p \u003c0.0001, fastText: p \u003c0.0001)。新規ALS原因候補遺伝子として、9遺伝子が同定され、ALS108例中8例にRDVを認めた。下位10%のALS-RVgは2遺伝子のみで、RDVは認めず、RDVを持つ症例の比率に有意な差を認めた(p = 0.0039)。【考察】CST10%遺伝子ではそれ以下の群と比較して、ALS-RVgが有意に多かった。さらにCST10%遺伝子群は、既存のALS原因遺伝子の特徴を有した。このことはテキストマイニングによる候補遺伝子抽出が機能している可能性を示した。新規ALS原因候補遺伝子にはスプライシング関連遺伝子4遺伝子にRDVを見いだした。これらRDVの病原性を今後検討したい。", "subitem_description_language": "ja", "subitem_description_type": "Abstract"}]}, "item_6_description_53": {"attribute_name": "学位記番号", "attribute_value_mlt": [{"subitem_description": "新大院博(医)第1020号", "subitem_description_language": "ja", "subitem_description_type": "Other"}]}, "item_6_dissertation_number_52": {"attribute_name": "学位授与番号", "attribute_value_mlt": [{"subitem_dissertationnumber": "甲第4930号"}]}, "item_6_relation_28": {"attribute_name": "他の資源との関係", "attribute_value_mlt": [{"subitem_relation_type": "isIdenticalTo", "subitem_relation_type_id": {"subitem_relation_type_id_text": "https://hdl.handle.net/10191/0002000678", "subitem_relation_type_select": "HDL"}}]}, "item_access_right": {"attribute_name": "アクセス権", "attribute_value_mlt": [{"subitem_access_right": "open access", "subitem_access_right_uri": "http://purl.org/coar/access_right/c_abf2"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "畠野, 雄也", "creatorNameLang": "ja"}, {"creatorName": "Hatano, Yuya", "creatorNameLang": "en"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"date": [{"dateType": "Available", "dateValue": "2022-05-10"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "r3nmk1020.pdf", "filesize": [{"value": "1.76MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": "1.76MB", "url": {"label": "本文", "objectType": "fulltext", "url": "https://niigata-u.repo.nii.ac.jp/record/2000462/files/r3nmk1020.pdf"}, "version_id": "3f1a05e2-18e2-4a59-9822-0352a91b3d49"}, {"date": [{"dateType": "Available", "dateValue": "2022-05-10"}], "displaytype": "detail", "download_preview_message": "", "file_order": 1, "filename": "r3nmk1020_a.pdf", "filesize": [{"value": "439KB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": "439KB", "url": {"label": "要旨", "objectType": "abstract", "url": "https://niigata-u.repo.nii.ac.jp/record/2000462/files/r3nmk1020_a.pdf"}, "version_id": "de40ee55-82c9-4bfa-a7f7-88a9e44321e1"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "筋萎縮性側索硬化症", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "テキストマイニング", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}, {"subitem_subject": "word2vec", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}, {"subitem_subject": "fastText", "subitem_subject_language": "en", "subitem_subject_scheme": "Other"}, {"subitem_subject": "エクソーム解析", "subitem_subject_language": "ja", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "doctoral thesis", "resourceuri": "http://purl.org/coar/resource_type/c_db06"}]}, "item_title": "テキストマイニングを用いた筋萎縮性側索硬化症の新規関連候補遺伝子の抽出", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "テキストマイニングを用いた筋萎縮性側索硬化症の新規関連候補遺伝子の抽出", "subitem_title_language": "ja"}, {"subitem_title": "Identification of novel causative genes for amyotrophic lateral sclerosis using textmining.", "subitem_title_language": "en"}]}, "item_type_id": "6", "owner": "1", "path": ["455", "562"], "permalink_uri": "http://hdl.handle.net/10191/0002000462", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2022-05-10"}, "publish_date": "2022-05-10", "publish_status": "0", "recid": "2000462", "relation": {}, "relation_version_is_last": true, "title": ["テキストマイニングを用いた筋萎縮性側索硬化症の新規関連候補遺伝子の抽出"], "weko_shared_id": -1}
テキストマイニングを用いた筋萎縮性側索硬化症の新規関連候補遺伝子の抽出
http://hdl.handle.net/10191/0002000462
http://hdl.handle.net/10191/000200046244947e58-5321-4200-81e7-e2932463f9f0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
|
![]() |
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2022-05-10 | |||||||||
タイトル | ||||||||||
言語 | ja | |||||||||
タイトル | テキストマイニングを用いた筋萎縮性側索硬化症の新規関連候補遺伝子の抽出 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Identification of novel causative genes for amyotrophic lateral sclerosis using textmining. | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
言語 | ja | |||||||||
主題Scheme | Other | |||||||||
主題 | 筋萎縮性側索硬化症 | |||||||||
キーワード | ||||||||||
言語 | ja | |||||||||
主題Scheme | Other | |||||||||
主題 | テキストマイニング | |||||||||
キーワード | ||||||||||
言語 | en | |||||||||
主題Scheme | Other | |||||||||
主題 | word2vec | |||||||||
キーワード | ||||||||||
言語 | en | |||||||||
主題Scheme | Other | |||||||||
主題 | fastText | |||||||||
キーワード | ||||||||||
言語 | ja | |||||||||
主題Scheme | Other | |||||||||
主題 | エクソーム解析 | |||||||||
資源タイプ | ||||||||||
資源 | http://purl.org/coar/resource_type/c_db06 | |||||||||
タイプ | doctoral thesis | |||||||||
アクセス権 | ||||||||||
アクセス権 | open access | |||||||||
アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||||
著者 |
畠野, 雄也
× 畠野, 雄也
|
|||||||||
抄録 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | 【緒言】筋萎縮性側索硬化症(Amyotrophic lateral sclerosis : ALS)の原因遺伝子は30種類以上が知られている。しかし、大家系が少なくなる一方、エクソーム解析で遺伝子多型が多数同定され、これらの病的意義を検討するのが困難となっている。遺伝子多型を認める遺伝子の中から、ALSの原因としての候補遺伝子を効率よく抽出し、病的意義を解析することが求められている。テキストマイニングは、テキスト情報から、類似する性質の単語を抽出する方法である。近年、IBM社の人工知能Watsonを用い、テキストマイニングによりALSの原因候補遺伝子の抽出が行われた。しかし、得られた候補遺伝子に対して、当該遺伝子に変異を持つ例は見出されておらず、その意義は不明である。著者はオープンソースのテキストマイニングであるword2vec/fastTextを用いALSの原因候補遺伝子の抽出を試み、それらの遺伝子の変異の有無をALS剖検例で検討し、その意義を検証した。【方法】word2vecおよびfastTextを用いて2000年から2019年にPubMed上に公開された英語論文163948報の抄録を解析した。ALSの原因遺伝子の約3割はRNA結合蛋白質(RNA binding protein : RBP)である。よって、1164個のRBP遺伝子を、既知の11種類のALS原因RBP遺伝子との類似度(テキストマイニングにおけるcos類似度)が高い順に順位付けし 、ALS原因遺伝子の候補順とした。上位10%をCST10%遺伝子(cosine similarity top10% gene)と命名した。また、既報のメタアナライシスデータより、ALSと非神経疾患ないし一般人集団コントロール群の間で、Rare damaging variant(RDV)の出現頻度が、コントロールに比してALS群に有意に多い遺伝子をALS-RVgと定義した。本法の正当性を、CST10%遺伝子の中で1) ALS-RVgの頻度、2) アノテーションに用いられたGene ontology(GO)termの解析、3) アミノ酸配列から予測した天然変性領域とcos類似度の順位との関連の検討を行った。さらにCST10%遺伝子のうちALS-RVgを新規ALS原因候補遺伝子とし、病理診断ALS108症例でRDVを検索した。【結果】2012年度までのテキストデータを用いた解析で、word2vecではcos類似度上位10%内に、2013年以降に同定された原因遺伝子が含まれた。word2vecでは、CST10%遺伝子群はそれ以外の遺伝子群と比して、ALS-RVgが有意に多かった(word2vec: p = 0.0044, fastText: pp = 0.073)。しかし、多重検定補正後の、q値 0.05未満の遺伝子はなかった。またGO解析では、CST10%遺伝子は、スプライシングに関係する遺伝子が多かった。cos類似度上位上位の遺伝子群は下位の遺伝子群と比べて、天然変性領域の占める割合が大きい傾向にあった(word2vec: p <0.0001, fastText: p <0.0001)。新規ALS原因候補遺伝子として、9遺伝子が同定され、ALS108例中8例にRDVを認めた。下位10%のALS-RVgは2遺伝子のみで、RDVは認めず、RDVを持つ症例の比率に有意な差を認めた(p = 0.0039)。【考察】CST10%遺伝子ではそれ以下の群と比較して、ALS-RVgが有意に多かった。さらにCST10%遺伝子群は、既存のALS原因遺伝子の特徴を有した。このことはテキストマイニングによる候補遺伝子抽出が機能している可能性を示した。新規ALS原因候補遺伝子にはスプライシング関連遺伝子4遺伝子にRDVを見いだした。これらRDVの病原性を今後検討したい。 | |||||||||
言語 | ja | |||||||||
他の資源との関係 | ||||||||||
関連タイプ | isIdenticalTo | |||||||||
識別子タイプ | HDL | |||||||||
関連識別子 | https://hdl.handle.net/10191/0002000678 | |||||||||
学位名 | ||||||||||
言語 | ja | |||||||||
学位名 | 博士(医学) | |||||||||
学位授与機関 | ||||||||||
学位授与機関識別子Scheme | kakenhi | |||||||||
学位授与機関識別子 | 13101 | |||||||||
言語 | ja | |||||||||
学位授与機関名 | 新潟大学 | |||||||||
言語 | en | |||||||||
学位授与機関名 | Niigata University | |||||||||
学位授与年月日 | ||||||||||
学位授与年月日 | 2021-09-21 | |||||||||
学位授与番号 | ||||||||||
学位授与番号 | 甲第4930号 | |||||||||
学位記番号 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 新大院博(医)第1020号 | |||||||||
言語 | ja |