石のひとりごと

停年退職してもう12年,頭が白くなりました.

Web of Science

久しぶりに大学図書館へ寄った.少し時間があったのでWeb of Scienceで遊ぶ.
 
1992年-2001年の9年間に日本から出された地球科学の論文の総被引用数の頻度分布.この期間に出された論文数は8883本.
 
イメージ 1
 
対数正規分布になるかとおもったのだが,全然へんてこな分布.平均値は14で,中央値は5と低い.どう考えるかはあまりアイデアはない.
 
これを作るのには15分位でできた.Web of Scienceではデータが10000を越えると統計処理ができないので,10000以下の数で適当な範囲を設定するのに少し試行錯誤が必要だったが,一旦方針が決まれば5分でデータはとれる.
 
9月5日修正: 昨日のデータ処理は横幅が等間隔でないので(対数),今日取り直してみた.
Web of Scienceでまず,1990年1月1日-1999年1月1日の範囲で所属がJapanでまず検索し,次にその中からAbstractやCorrectionを外し,その中で分野をGeoscience MultidisciplinaryとGeophysics and Geochemistryを選択し,得られたデータを被引用数順に並べて,頻度を数える.上の図ではAbstract等Articleの種類を全部入れた形にして期間も少しずれる.
イメージ 2
最初の図と随分違って見える.かなり対数正規分布に近い.図はやはりきちんと作るべきものか.Abstractを除くことで低い総被引用数のArticleが減ってきれいになったらしい.最大はOkada(1992)BSSAの921回.