[model_cards] xlnet_chinese_large & roberta_chinese_large

2025-07-31 02:02:21 +06:00 · 2020-04-24 16:12:42 -04:00 · 2020-04-24 16:12:42 -04:00 · 73d6a2f901
commit 73d6a2f901
parent 623ba0236d
6 changed files with 84 additions and 0 deletions
--- a/model_cards/clue/albert_chinese_small/README.md
+++ b/model_cards/clue/albert_chinese_small/README.md
@ -1,3 +1,7 @@
+---
+language: chinese
+---
+
 ## albert_chinese_small

 ### Overview
--- a/model_cards/clue/albert_chinese_tiny/README.md
+++ b/model_cards/clue/albert_chinese_tiny/README.md
@ -1,3 +1,7 @@
+---
+language: chinese
+---
+
 ## albert_chinese_tiny

 ### Overview
--- a/model_cards/clue/roberta_chinese_3L312_clue_tiny/README.md
+++ b/model_cards/clue/roberta_chinese_3L312_clue_tiny/README.md
@ -1,3 +1,7 @@
+---
+language: chinese
+---
+
 # Introduction
 This model was trained on TPU and the details are as follows:

--- a/model_cards/clue/roberta_chinese_base/README.md
+++ b/model_cards/clue/roberta_chinese_base/README.md
@ -1,3 +1,7 @@
+---
+language: chinese
+---
+
 ## roberta_chinese_base

 ### Overview
--- a/model_cards/clue/roberta_chinese_large/README.md
+++ b/model_cards/clue/roberta_chinese_large/README.md
@ -0,0 +1,35 @@
+---
+language: chinese
+---
+
+## roberta_chinese_large
+
+### Overview
+
+**Language model:** roberta-large
+**Model size:** 1.2G
+**Language:** Chinese
+**Training data:** [CLUECorpusSmall](https://github.com/CLUEbenchmark/CLUECorpus2020)
+**Eval data:** [CLUE dataset](https://github.com/CLUEbenchmark/CLUE)
+
+### Results
+
+For results on downstream tasks like text classification, please refer to [this repository](https://github.com/CLUEbenchmark/CLUE).
+
+### Usage
+
+**NOTE:** You have to call **BertTokenizer** instead of RobertaTokenizer !!!
+
+```
+import torch
+from transformers import BertTokenizer, BertModel
+tokenizer = BertTokenizer.from_pretrained("clue/roberta_chinese_large")
+roberta = BertModel.from_pretrained("clue/roberta_chinese_large")
+```
+
+### About CLUE benchmark
+
+Organization of Language Understanding Evaluation benchmark for Chinese: tasks & datasets, baselines, pre-trained Chinese models, corpus and leaderboard.
+
+Github: https://github.com/CLUEbenchmark
+Website: https://www.cluebenchmarks.com/
--- a/model_cards/clue/xlnet_chinese_large/README.md
+++ b/model_cards/clue/xlnet_chinese_large/README.md
@ -0,0 +1,33 @@
+---
+language: chinese
+---
+
+## xlnet_chinese_large
+
+### Overview
+
+**Language model:** xlnet-large
+**Model size:** 1.3G
+**Language:** Chinese
+**Training data:** [CLUECorpusSmall](https://github.com/CLUEbenchmark/CLUECorpus2020)
+**Eval data:** [CLUE dataset](https://github.com/CLUEbenchmark/CLUE)
+
+### Results
+
+For results on downstream tasks like text classification, please refer to [this repository](https://github.com/CLUEbenchmark/CLUE).
+
+### Usage
+
+```
+import torch
+from transformers import XLNetTokenizer,XLNetModel
+tokenizer = XLNetTokenizer.from_pretrained("clue/xlnet_chinese_large")
+xlnet = XLNetModel.from_pretrained("clue/xlnet_chinese_large")
+```
+
+### About CLUE benchmark
+
+Organization of Language Understanding Evaluation benchmark for Chinese: tasks & datasets, baselines, pre-trained Chinese models, corpus and leaderboard.
+
+Github: https://github.com/CLUEbenchmark
+Website: https://www.cluebenchmarks.com/