Resources - LLM-jp

LLM-jp

HOME - Resources

Resources

Documents / Slides

We also publish an “Overview of Japanese LLMs” on GitHub. Click below to learn more.

Working Group / Talks & Reports

Session

List of Public Resources

LLM-jp Status Report
Kurohashi

Exclusive Unlearning
Sasaki

Investigating Internal Operations for Long Distance Dependencies in Language Models
Kimura

Fact-Checking of LLM-Generated Texts
Kiyomaru, Masano

Improving the Accuracy of Sensitive Personal Information Detection in Large-Scale Corpora
Minamoto

Demystifying Mixed Outcomes of Self-Training: Pre-training Analyses on Non-Toy LLMs
Nakamura

Tracing Multilingual Knowledge Acquisition Dynamics in Domain Adaptation: A Case Study of Biomedical Adaptation
Zhao

Construction of a Large-Scale Audio Acoustic Dataset Using Common Crawl
Asai

LLM-jp Status Report
Kurohashi

Release of Japanese-Specialized Diffusion Language Model ‘ELYZA-LLM-Diffusion’
Trisitichoke Tasavat/ELYZA

Building Japanese-English Reasoning Large Language Models with Swallow
Mizuki/Institute of Science Tokyo

Evaluation and Tuning WG
Miyao

Corpus Construction WG
Kawahara

Safety WG
Suzuki

Safety WG
Sekine

Model Building WG
Suzuki

Academic Domain WG
Aizawa

Dialogue WG
Higashinaka

Real-world Interaction WG
Kurita

Model Building WG
Suzuki

Safety WG
Sekine

Corpus Construction WG
Kawahara

Real-world Interaction WG
Ogata

Evaluation and Tuning WG
Miyao

LLM-jp Status Report
Kurohashi

Harnessing AI Agents for Real-World Applications
Kwasi Ankomah / SambaNova

Mid-training for LLM
Kodama

Dialogue WG
Higashinaka

Real-world Interaction WG
Ogata

Safety WG
Sekine

Corpus Construction WG
Kawahara

LLM-jp Status Report
Kurohashi

Evaluating the Faithfulness and Readability of RL-Tuned LLMs
Chaoran Liu

The First Workshop on Fine-Tuning and Evaluating LLMs: A Report
Namgi Han/UT|Katsumata/Retrieva|Miyao|Kiyomaru

Model Building WG
Suzuki

Evaluation and Tuning WG
Miyao

Dialogue WG
Higashinaka

Evaluation and Tuning WG
Miyao

Corpus Construction WG
Kawahara

Safety WG
Sekine

Safety WG
Sekine

Safety WG
Sekine

Model Building WG
Suzuki

Real-world Interaction WG
Ogata

Dialogue WG
Higashinaka

LLM-jp Status Report
Kurohashi

Crawling the Japanese Web
Tamura/ROIS

The Insight We Gained from the Development of Llama 3.1 Future Code Ja
Ryo Fujii/Future

LLM-jp Status Report
Kurohashi

Research and Development of an Open Japanese Medical LLM
Kobayashi

Corpus Construction WG
Kawahara

Real-world Interaction WG
Ogata

Safety WG
Sekine

Model Building WG
Suzuki

Evaluation and Tuning WG
Miyao

Dialogue WG
Higashinaka

LLM-jp Status Report
Kurohashi

Historical Texts and LLMs: Corpus Construction and Utilization
Kitamoto/NII

JPharmatron & JPharmaBench: A Japanese Language Model and Evaluation Benchmarks for Pharmaceutical NLP
Ono/UT EQUES

Evaluation and Tuning WG
Miyao

Real-world Interaction WG
Ogata

Dialogue WG
Higashinaka

Corpus Construction WG
Kawahara

Safety WG
Sekine

Model Building WG
Suzuki

Academic Domain WG
Aizawa

LLM-jp Status Report
Kurohashi

NTT’s Large Language Model: tsuzumi 2
Nishida/NTT

Papers Accepted at EMNLP2025
Inaba

Papers Accepted at EMNLP2025
Nishida

Papers Accepted at EMNLP2025
Harada

Papers Accepted at EMNLP2025
Furuhashi

Academic Domain WG
Aizawa

Corpus Construction WG
Kawahara