Stockmark-100b: ビジネスドメインに対応した1000億パラメータ規模の大規模言語モデルの事前学習
Research Stockmark Research
Publications 成果
言語モデル |
最近の話題にも詳しい14億パラメータの日本語LLMの公開
論文 |WAIN 2022 : 2nd IEEE ICDM International Workshop on AI for Nudging and Personalization
Multi-purpose Recommender Platform using Perceiver IO
言語モデル |
日本語ビジネスニュースコーパスを学習したBART事前学習済モデル
言語モデル |
ストックマークが公開した言語モデル一覧
データセット |
Wikipediaを用いた日本語の固有表現抽出データセット
Blog Stockmark Tech Blog
Member メンバー
-
-
Wataru Hirota
広田 航
ユニットリーダー (Research)
ストックマーク株式会社にて自然言語処理の研究開発に従事。2020年大阪大学情報科学研究科修了、修士 (情報科学)。その後米国に渡り、Megagon Labs で会話エンジンと Entity Matching に関する研究に従事。2021年9月より現職。
-
Kenichiro Kobayashi
小林 賢一郎
Researcher
東芝およびソニーの研究所において自然言語処理、人工知能、ロボット(AIBO、QRIO)、データ解析の研究やCE機器の研究開発に従事。2007 年よりソニーの主任研究員に就任。電子情報産業協会委員などを歴任。2015年、クーロン株式会社のフェロー。2016年よりTIS株式会社シニアエキスパートのほか複数のベンチャー企業のアドバイザーを務める。同年、GAtechnologiesに顧問としてジョイン、2017年よりAI戦略室室長に。同年、三菱鉛筆の顧問に就任。2021年4月にストックマークに入社。
-
Makoto Morinaga
森長 誠
Senior Researcher
ストックマーク株式会社にて自然言語処理の研究開発に従事。 2010年に北海道大学大学院情報科学研究科修士課程修了。修士(情報科学)。その後は、2018年まで日鉄ソリューションズにて官公庁向けのインフラ及びミドルウェア構築案件を担当。2019年1月より現職。現職では、Deep Learning技術を中心にアルゴリズムの検証・実装・モデル化を担当。
-
Ali Emami
江間見 亜利
Researcher
ストックマーク株式会社にて自然言語処理の研究開発に従事。 2018年に東京大学大学院工学系研究科博士課程修了。博士(工学)。その後は、Yahoo! JAPANグループのシナジーマーケティング株式会社に入社して、人工知能を中心とする研究に従事。2020年4月より現職。
-
Naveed Afzal
アフザル ナヴィード
Researcher
ストックマーク株式会社にて自然言語処理の研究開発に従事。2015年に来日し、東京工業大学情報理工学研究科でネットワーク構造データを適用した深層学習の研究を行って2017に修士課程修了。その後、エーアイスクエアで対話分析の研究開発に従事。2022年5月より現職。構造データを扱う機械学習手法の研究に関心がある。
-
Kosuke Takahashi
高橋 洸丞
Researcher
ストックマーク株式会社にて自然言語処理の研究開発に従事。 2020年に奈良先端大学院大学先端科学研究科博士前期課程修了。同大学博士後期課程では機械翻訳向けの自動評価に関する研究を行った。2023年4月より現職。
Recruit 採用について
"言葉のAI"ですべての日本企業を進化させたい。
数字だけでなく「テキストデータ」から導き出される意思決定は、
人類をより創造的にしていくと私たちは確信しています。
そんな進化のドラマを一緒につくりましょう。