📄 Documents

89 documents

Sort byName·arXiv ID·Uploaded ↑

SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian LanguagesarXiv:2406.10118 · 15-Apr-2026
Which Humans?arXiv:2506.14680 · 15-Apr-2026
SEA-BED: How Do Embedding Models Represent Southeast Asian Languages?arXiv:2508.12243 · 15-Apr-2026
Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual EvaluationarXiv:2412.03304 · 15-Apr-2026
Is Small Language Model the Silver Bullet to Low-Resource Languages Machine Translation?arXiv:2503.24102 · 15-Apr-2026
SEA-LION: Southeast Asian Languages in One NetworkarXiv:2504.05747 · 15-Apr-2026
ProverbEval: Exploring LLM Evaluation Challenges for Low-resource LanguagesarXiv:2411.05049 · 15-Apr-2026
SEA-HELM: Southeast Asian Holistic Evaluation of Language ModelsarXiv:2502.14301 · 15-Apr-2026
Bhaasha, Bhasa, Zaban: A Survey for Low-Resourced Languages in South Asia -- Current Stage and ChallengesarXiv:2509.11570 · 16-Apr-2026
FILBENCH: Can LLMs Understand and Generate Filipino?arXiv:2508.03523 · 16-Apr-2026
English is Not All You Need: Systematically Exploring the Role of Multilinguality in LLM Post-TrainingarXiv:2604.13286 · 16-Apr-2026
Mind the Gap: Pitfalls of LLM Alignment with Asian Public OpinionarXiv:2603.06264 · 16-Apr-2026
Toward Robust Multilingual Adaptation of LLMs for Low-Resource LanguagesarXiv:2510.14466 · 16-Apr-2026
BURMESE-SAN: Burmese NLP Benchmark for Evaluating Large Language ModelsarXiv:2602.18788 · 16-Apr-2026
SailCompass: Towards Reproducible and Robust Evaluation for Southeast Asian LanguagesarXiv:2412.01186 · 16-Apr-2026
MERIT: Multilingual Expert-Reward Informed Tuning for Chinese-Centric Low-Resource Machine TranslationarXiv:2604.04839 · 16-Apr-2026
SeaLLMs-Audio: Large Audio-Language Models for Southeast AsiaarXiv:2511.01670 · 16-Apr-2026
Multilingual Text RepresentationarXiv:2309.00949 · 17-Apr-2026
Towards Building Speech Large Language Models for Multitask Understanding in Low-Resource LanguagesarXiv:2509.14804 · 17-Apr-2026
Bridging Linguistic Gaps: Cross-Lingual Mapping in Pre-Training and Dataset for Enhanced Multilingual LLM PerformancearXiv:2604.10590 · 17-Apr-2026
BHASA: A Holistic Southeast Asian Linguistic and Cultural Evaluation Suite for Large Language ModelsarXiv:2309.06085 · 17-Apr-2026
LaoBench: A Large-Scale Multidimensional Lao BenchmarkarXiv:2511.11334 · 17-Apr-2026
Learning Speech Representations with Variational Predictive CodingarXiv:2601.00100 · 17-Apr-2026
The Geometry of Multilingual Language Models: An Equality LensarXiv:2305.07839 · 17-Apr-2026
Enhancing Multilingual RAG Systems with Debiased LanguagearXiv:2601.02956 · 17-Apr-2026
The Hidden Space of Safety: Understanding Preference-Tuned LLMs in Multilingual contextarXiv:2504.02708 · 17-Apr-2026
OpenSeal: Good, Fast, and Cheap Construction of an Open-Source Southeast Asian LLM via Parallel DataarXiv:2602.02266 · 17-Apr-2026
Tokenization Disparities as Infrastructure Bias: How Subword Systems Create Inequities in LLM Access and EfficiencyarXiv:2510.12389 · 17-Apr-2026
Mining Large Language Models for Low-Resource Language Data: Comparing Elicitation Strategies for Hausa and FongbearXiv:2604.12477 · 17-Apr-2026
Large Multimodal Models for Low-Resource Languages: A SurveyarXiv:2502.05568 · 17-Apr-2026
Opportunities and Challenges of Large Language Models for Low-Resource Languages in Humanities ResearcharXiv:2412.04497 · 17-Apr-2026
Rethinking what Matters: Effective and Robust Multilingual Realignment for Low-Resource LanguagesarXiv:2511.06497 · 17-Apr-2026
mSTEB: Massively Multilingual Evaluation of LLMs on Speech and Text TasksarXiv:2506.08400 · 17-Apr-2026
SEA-SafeguardBench: Evaluating AI Safety in SEA Languages and CulturesarXiv:2512.05501 · 17-Apr-2026
Unlocking Multilingual Reasoning Capability of LLMs and LVLMs through Representation EngineeringarXiv:2511.23231 · 17-Apr-2026
Debiasing Large Language Models in Thai Political Stance Detection via Counterfactual CalibrationarXiv:2509.21946 · 17-Apr-2026
ShifCon: Enhancing Non-Dominant Language Capabilities with a Shift-based Multilingual Contrastive FrameworkarXiv:2410.19453 · 17-Apr-2026
BBPE16: UTF-16-based byte-level byte-pair encoding for improved multilingual speech recognitionarXiv:2602.01717 · 17-Apr-2026
SeaExam and SeaBench: Benchmarking LLMs with Local Multilingual Questions in Southeast AsiaarXiv:2410.12462 · 17-Apr-2026
LASA: Language-Agnostic Semantic Alignment at the Semantic Bottleneck for LLM SafetyarXiv:2604.12710 · 17-Apr-2026
SeaExam and SeaBench: Benchmarking LLMs with Local Multilingual Questions in Southeast AsiaarXiv:2502.06298 · 17-Apr-2026
When Meaning Isn't Literal: Exploring Idiomatic Meaning Across Languages and ModalitiesarXiv:2604.10787 · 17-Apr-2026
SeaLLMs 3: Open Foundation and Chat Multilingual Large LanguagearXiv:2407.19672 · 17-Apr-2026
SEALGuard: Safeguarding the Multilingual Conversations in Southeast Asian Languages for LLM Software SystemsarXiv:2507.08898 · 17-Apr-2026
Cross-Lingual Activation Steering for Multilingual Language ModelsarXiv:2601.16390 · 17-Apr-2026
Tokenization and Representation Biases in Multilingual Models on Dialectal NLP TasksarXiv:2509.20045 · 17-Apr-2026
Language on Demand, Knowledge at Core: Composing LLMs with Encoder-Decoder Translation Models for Extensible MultilingualityarXiv:2603.17512 · 17-Apr-2026
The Serendipity of Claude AI: Case of the 13 Low-Resource National Languages of MaliarXiv:2503.03380 · 17-Apr-2026
Mangosteen: An Open Thai Corpus for Language Model PretrainingarXiv:2507.14664 · 17-Apr-2026
Typologically-Informed Candidate Reranking for LLM-based Translation into Low-Resource LanguagesarXiv:2602.01162 · 17-Apr-2026
Rice-VL: Evaluating Vision-Language Models for Cultural Understanding Across ASEAN CountriesarXiv:2512.01419 · 17-Apr-2026
Benchmarking Concept-Spilling Across Languages in LLMsarXiv:2601.12549 · 17-Apr-2026
VietJobs: A Vietnamese Job Advertisement DatasetarXiv:2603.05262 · 17-Apr-2026
The Token Tax: Systematic Bias in Multilingual TokenizationarXiv:2509.05486 · 19-Apr-2026
Benchmarking Linguistic Adaptation in Comparable-Sized LLMs: A Study of Llama-3.1-8B, Mistral-7B-v0.1, and Qwen3-8B on Romanized NepaliarXiv:2604.14171 · 19-Apr-2026
XQ-MEval: A Dataset with Cross-lingual Parallel Quality for Benchmarking Translation MetricsarXiv:2604.14934 · 19-Apr-2026
Multilingual Large Language Models do not comprehend all natural languages to equal degreesarXiv:2602.20065 · 20-Apr-2026
SeaLLMs - Large Language Models for Southeast AsiaarXiv:2312.00738 · 21-Apr-2026
Compass-v3: Scaling Domain-Specific LLMs for Multilingual E-Commerce in Southeast AsiaarXiv:2509.09121 · 24-Apr-2026
Robust Bias Evaluation with FilBBQ: A Filipino Bias Benchmark for Question-Answering Language ModelsarXiv:2602.14466 · 28-Apr-2026
Mind the Language Gap: Automated and Augmented Evaluation of Bias in LLMs for High- and Low-Resource LanguagesarXiv:2504.18560 · 29-Apr-2026
Sailor2: Sailing in South-East Asia with Inclusive Multilingual LLMsarXiv:2502.12982 · 01-May-2026
Deep Language Geometry: Constructing a Metric Space from LLM WeightsarXiv:2508.11676 · 04-May-2026
Multilingual Language ModelsarXiv:2604.05090 · 05-May-2026
On the limited utility of parallel data for learning shared multilingual representationsarXiv:2603.29026 · 05-May-2026
All Languages Matter: Understanding and Mitigating Language Bias in Multilingual RAGarXiv:2604.20199 · 06-May-2026
Neither Here Nor There: Cross-Lingual Representation Dynamics of Code-Mixed Text in Multilingual EncodersarXiv:2603.19771 · 07-May-2026
Representing the Under-Represented: Cultural and Core Capability Benchmarks for Developing Thai Large Language ModelsarXiv:2410.04795 · 08-May-2026
The Roots of Performance Disparity in Multilingual Language Models: Intrinsic Modeling Difficulty or Design Choices?arXiv:2601.07220 · 11-May-2026
Adapting Multilingual LLMs to Low-Resource Languages using Continued Pre-training and Synthetic CorpusarXiv:2410.14815 · 12-May-2026
Language Ranker: A Metric for Quantifying LLM Performance Across High and Low-Resource LanguagesarXiv:2404.11553 · 13-May-2026
Babel: Open Multilingual Large Language Models Serving Over 90% of Global SpeakersarXiv:2503.00865 · 15-May-2026
Assessing Thai Dialect Performance in LLMs with Automatic Benchmarks and Human EvaluationarXiv:2504.05898 · 19-May-2026
Multilingual != Multicultural: Evaluating Gaps Between Multilingual Capabilities and Cultural Alignment in LLMsarXiv:2502.16534 · 20-May-2026
Reinforcement Learning with Semantic Rewards Enables Low-Resource Language Expansion without Alignment TaxarXiv:2605.14366 · 21-May-2026
Unraveling the Token Dynamics of Large Language Models for Machine TranslationarXiv:2605.07533 · 25-May-2026
Multilingual Knowledge Transfer under Data Constraints via Lexical InterventionsarXiv:2605.23885 · 26-May-2026
The State of Multilingual LLM Safety Research: From Measuring the Language Gap to Mitigating ItarXiv:2505.24119 · 08-Jun-2026
Myanmar XNLI: Building a Dataset and Exploring Low-resource Approaches to Natural Language Inference with MyanmararXiv:2504.09645 · 08-Jun-2026
Your UnEmbedding Matrix is Secretly a Feature Lens for Text EmbeddingsarXiv:2606.07502 · 09-Jun-2026
MultiHaluDet: Multilingual Hallucination Detection via LLM Hidden State ProbingarXiv:2605.24919 · 11-Jun-2026
Marco-LLM: Bridging Languages via Massive Multilingual Training for Cross-Lingual EnhancementarXiv:2412.04003 · 15-Jun-2026
Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information BottleneckarXiv:2603.10351 · 15-Jun-2026
Equity with Efficiency: An Empirical Study of Tokenizers for Multilingual Large Language ModelsarXiv:2606.15044 · 16-Jun-2026
MMTEB: Massive Multilingual Text Embedding BenchmarkarXiv:2502.13595 · 17-Jun-2026
The Shibboleth Effect: Auditing the Cross-Lingual Distributional Skew of Large Language ModelsarXiv:2606.11082 · 18-Jun-2026
Not All Languages are Equal: Insights into Multilingual Retrieval-Augmented GenerationarXiv:2410.21970 · 19-Jun-2026
Are Large Language Models for Education Reliable for All Languages?arXiv:2504.17720 · 22-Jun-2026
Want Better Synthetic Data? Steer It: Activation Steering for Low-Resource Language GenerationarXiv:2606.18389 · 22-Jun-2026