ムッシュM.ChatGPTの自己紹介、そのお手伝いをさせていただきました(その7)

 

前回はこちら

 


<俳人ムッシュM.ChatGPTここに在り!お手並み拝見‼>

 

 

<質問29>
GPT-3の場合、最大トークン数は4096トークンとのことを承りました。この場合のトークンという単位は、どのような内容なのか、わかりやすく教えてください。

 

ChatGPT
トークンは、テキストを形成する最小単位で、一般的には単語や句読点、スペースなどが含まれます。

ただし、トークンのサイズは一様ではなく、単語の長さや句読点のような区切り文字が1つのトークンとして数えられます。

例えば、「ChatGPT is great!」という文は、以下のようにトークンに分割されます:

 

1. ChatGPT

2. is

3. great

4. !

 

この場合、4つの単語と1つの句読点が5つのトークンとして数えられます。トークン数の制限が4096であれば、この例のような簡単な文でも、もっと複雑な文では4096までの制限があることを示しています。


なお、GPTモデルではサブワードトークン(単語を更に細かい単位に分割したもの)も使われることがあり、これにより単語の変化形や異なる形態を考慮することができます。しかし、最終的なトークン数の制約は、モデルのメモリや処理能力に影響を与えます。

 


飯嶋医師のコメント:
最短の文学といえば詩の中でも俳句が代表的かと思います。わずか数トークンで構成される詩型は、ムッシュChatGPTにとっては余裕のタスクということになるのでしょうか?

 

 

 

ChatGPTが俳句を作ってくれるというお話を、水氣道会員で俳句の趣味をもつN氏から伺いました。彼の目下のお題は、すすはらい(煤払い)とのことでした。


そこで、このお題で、ムッシュChatGPTに俳句を作って貰うことにしました。

 

<質問30>

煤払い(すすはらい)という季語を用いた俳句を5句作りたいと思います。

どうぞよろしくお願いいたします。

 


ChatGPT

1. 煤払い 屋根の上に 残る夕影

 

2. 雨の匂い 運ぶ煤払い 恋しき家

 

3. 煤払いの 音に包まれる 古き庭

 

4. 廃屋に 佇む煤払い 草花寂し

 

5. 町の灯り 煤払いの匂い 懐かしや

 

飯嶋医師のコメント:
5句の全てに、季語として指定した煤払い(下線は飯嶋)が配されています。

フォームの始まり俳句といえば五・七・五が基本型ですが、字余りや字足らずの作品も、日常豊富に見かけます。

 

上記の5句のすべてが字余りの句です。私の個人的な趣味で恐縮ですが、好みの俳句のリズムは、やはり基本型。

 

そこで、私もムッシュChatGPTの作品に着想を得て腰折れの一句を   

 

「戻り来し廃屋の壷、煤払い」