2023年はありがとうございました。2024年はよろしくお願いいたします。
2023年の振り返りです。
今年は主に転職活動をしていました。 2023年いっぱいで新卒入社した企業を退職し、2024年から別の企業に入社します。
気が向いたら転職関連の記事をどこかに投稿しようかな〜と思ってます。
来年は仕事だけでなく環境が色々と変化するので、プライベートも仕事も楽しんでいきたいと思います。
短い。
以上振り返り。
2022年はありがとうございました。2023年はよろしくお願いいたします。
2021年の振り返りは書き忘れました。今年も忘れかけた。
今年はついに関西から関東に異動となった年。色々あったけれど無事に異動できました。
ただ転職したい気持ちは年々強くなっているので、2023は何か作ったり書いたりして準備していきたいと思います。
関東に来てご飯行ってくれた方々ありがとうございました。また行きましょう。
仙台でずんだ餅を初めて食べたけど、これを早食いできるやつおっかしいよ。
以上振り返り。対決列島 (@ 甘味処 彦いち in 仙台市, 宮城県) https://t.co/rZxVWm4EFL pic.twitter.com/e48BIjHpZ3
— ぜろ🌓 (@Zer0lsm) 2022年9月18日
2020振り返り
この年は何したんだっけ?というのを後で見返せる何かを残したい。覚えてたら毎年やる。
SwarmとかTwitterを見ながら1年を振り返った。印象に残ったやつだけ書く。
2020
1月
- 特になし
2月
- 残業と休出が多くプライベートの時間は殆ど無かった。
3月
4月
- 仕事が少し楽になり(+在宅勤務が殆どとなり)プライベートの時間が確保できた。
- 競プロに本腰を入れようと思い、AtCoderに取り組む。Streakは142日(4月〜7月)まで伸びた。緑コーダーになった。嬉しい。
5月
- 特になし
6月
- 長期間の在宅勤務により太った体をなんとかしようとリングフィットアドベンチャーを頑張る。食生活も見直した。1ヶ月弱で在宅勤務前の体重になったが、ダイエットモチベーションが地に落ちる。だがまだ標準体重ではない。
7月
- G検定を受験。合格。
- 近所の寿司屋に通うようになる。
- 家のエアコンのリモコンを紛失。多くのメーカに対応する汎用的なリモコンを購入。夏を生きて乗り越えた。
8月
- スマホの回線を楽天モバイルからRakuten UN-LIMITに変更。1年無料も大きいが、電話し放題が良い。速度も文句がない。家が楽天エリアで良かった。
- TENETを観に行く。考察が捗る映画で凄く面白い。
- 神戸牛を食べに神戸へ行く。ぼっち。
9月
- 安全確保支援士の勉強をぼちぼち始める。結果IPAに貢いだ。
- カフェ勉をするようになる。平日は毎日のように通う。
- そろそろ彼女が欲しくなる。欲しいと思っているだけである。
10月
11月
- 呉に遊びに行く。ぼっち。
- スプラトゥーン2をようやく始める。おもろい。
12月
- スプラを遊んでくれる人が欲しく、Twitterでゲーム垢を作る。社会人になってネット友達ができるとは思っていなかった。めっちゃ楽しい。年末は毎日誰かしらに遊んでもらっている。
- 今年は帰省を諦め、ぼっち年越しをする。
おわりに
2020はコロナウィルスの影響により、ほとんど在宅勤務になった。何もなくても引きこもりなのに、これが家から出ない理由となり余計に外に殆ど出なかった1年だった。友達も近くにいないので遊びに行ったり飲みに行ったりすることはあまりない。仕事がある日でも、1日に2,3回くらいしか発声しない日もあり(独り言)悲しい気持ちになる。ここ1ヶ月はゲームをしてくれる友達ができたので気持ちは穏やか。早く関東に引っ越したい。
口だけずっと言っているが転職もしたい気持ちはある。一生今の会社にいるか?と言われると想像できないし、自分がカッコいいと思う姿になれそうもない。組織にお願いしたり訴えればええやんって思うかもしれないけど、そこまでして今の会社にいたいとは思わないし転職するのが一番楽そう。また、尊敬できる人・目標にしたい人が今の所おらず、なんだかなーという気持ちにもなる(多分これが大きい)。
今年で厄年も終わり。本厄・後厄の2年間では公私ともにしんどい思いをした時期があったけど、生きてるので偉い。
2021は、1つでも良いので興味のある技術等に詳しくなってみたいと思う。 それから、仕事がしんどくなりそうなので最近できたネット友達と遊びつつ程々に頑張りたい。
皆さま、来年も仲良くしてくれると嬉しいです。良いお年を。
G検定を受験した話
JDLA Deep Learning for GENERAL 2020#2を受験した。
確かM1のときにG検定始まるよ〜って知った。研究で忙しかったので当時は受けなかったけど、今回は半額だったのでラッキー!ってことで受けた。
本当は2020#1を受験しようと思って参考書の購入は済ませていたのだけど、炎上プロジェクトに放り込まれて見送った。
やったこと
以下の2冊を1周だけ。大学ではAIについて多少は学んでいたので、なるほど〜〜って言いながら読んでた。「CNNは画像認識、RNNは自然言語処理に効くらしい」くらいの知識しかなかったので、結構勉強になった。
徹底攻略 ディープラーニングG検定 ジェネラリスト 問題集 徹底攻略シリーズ
- 作者:スキルアップAI株式会社 明松真司,スキルアップAI株式会社 田原眞一
- 発売日: 2019/02/08
- メディア: Kindle版
学部生の頃に、「エージェントアプローチと人工知能」を読んでたのでAI全体の教養はあったのかもしれない。
- 作者:S.J.Russell,P.Norvig
- 発売日: 2008/07/10
- メディア: 単行本
勉強期間は5日くらい。たぶん。本腰入れてやったのは3日くらい。
結果
合格✌
G検定✌️ pic.twitter.com/fACzFgD62y
— ぜろ⛅ (@Zer0lsm) 2020年7月16日
感想
- 参考書読んでいたので分かっていたけど、もうちょっと数学的な中身を学びたかった。偏微分とか基本的な行列計算しかない。ジェネラリストだしこんなものなのかな。
- 試験時間が足りない。
- 法律系の問題が多い。
- 参考書の内容が3〜4割くらいしか出てなくて焦った。
- 試験の難易度は低いと思う。基本情報技術者のほうが100倍頑張った。
社会人になってから何の資格も取得していなかったので、「何かはやってるぞ」と会社にアピれる材料ができたので良し。
まとめ
難易度はどうであれ、G検定はMLの勉強の入門としては悪くないんじゃない?って思った。コロナウィルスの影響で情報処理試験の午前Ⅰ免除期間が延びたようだけど、秋試験どうするかなあ・・・
ちょっと良いヘッドホンを買った話
ちょっと良いヘッドホンを買いました。
買ったきっかけ
先日数ヶ月ぶりに話した兄におすすめされたため。 夏のボーナス🍆も入るし、給付金も使い道が決まっていなかったので、買ったろwと思って買った。
イヤホンはSONYのWF-1000XM3を持っているのだけど、 無線だし、まともなヘッドホンは買ったことがなかった。(てか家の中はスピーカーでいいよ〜って思ってた)
買ったやつ
購入したのはaudio-technicaのATH-M50x。値段はamazonで2万円ぴったりくらい。
モニターヘッドホンというやつで、名前の通りモニタリング用のヘッドホン。普通のヘッドホンは聴きやすいよう調整されているが、モニターヘッドホンは精密に低音〜高音が出力されるらしい。
入手してからまだ3日程度しか経っていないが、感動している。今まで聞こえてこなかった音達が左右から聞こえてきて、今まで聞いていたものは何だったの?という気持ち。
音楽経験者?でもないし、音質もそこまで気にしていなかったのだけど、値段以上の価値があり、久々に良い買い物をしたという話。
おわり。
線路ネットワークを解析してみた
本記事はFUN Advent Calendar 2018の15日目の記事です.
昨日は_n_el君でした.
自己紹介
本記事では
日本の電車の路線ネットワークの解析をやります.駅データ.jpさんからデータをいただきました.ここには,JR(新幹線含む),地下鉄,市電なんかも入っています.
本来であれば,重みを距離や所要時間として解析するのが好ましいのですが,今回は面倒なので重みなしの無向ネットワークで解析をします(駅:ノード,路線:エッジ). なお,新幹線は抜きでやります(重みがないため,東京函館間などが凄く近くなってしまうため).
アルゴリズムの説明などはしないので,興味があればリンク先の説明を読んでみてください.
ネットワーク構造
複雑ネットワークには,スケールフリーネットワークというものがある.これは,横軸に次数,縦軸にその頻度をとったときに,べき乗則に従うネットワークのこと.
上のグラフでは,次数2の駅が8000個あるということ.次数1の駅は当然少ないわけで,べき乗の形はしていない.しかし,次数2以降を見れば,べき乗っぽく見えるかも.
べき乗則に従うということは,両対数をとれば当然線形になる.ということで,一応プロットしたのが以下.
次数2以降はわりと直線に近いことがわかった.
日本の中心の駅はどこか
さて,じゃあ日本の駅の中で中心にあるのはどこなんだろうか.複雑ネットワークには中心性というものがいくつかあるのだが,今回は媒介中心性を使ってみる.簡単に言うと,あるノードが任意の2つのノードの最短経路上にどの程度あるのかというもの.
上位5件は以下.
駅 | 媒介中心性 | |
---|---|---|
1 | 塩尻(長野県) | 0.3728 |
2 | 恵那(岐阜県) | 0.3671 |
3 | 美乃坂本(岐阜県) | 0.3661 |
4 | 中津川(岐阜県) | 0.366 |
5 | 落合川(岐阜県) | 0.366 |
上位5件では長野県・岐阜県しかないのだが,近畿・中部地方がトップを独占していることがわかった.これは感覚的にも正しい気がする.ちなみに,東京都の駅で最も媒介中心性が高かったのは147位の八王子駅だった.
次数中心性を使えば,関東地方の駅が多く上位に入ってくるのは間違いないだろう.
町田は神奈川?
「町田は神奈川」というように,町田はよくネタにされる.じゃあ,ネットワーク構造的に町田駅は東京都よりなのか,それとも神奈川県よりなのかを知りたい.
コミュニティ抽出
今回はLouvain Modularityを使ってみた.以下のネットワークは町田駅が属しているコミュニティ.
町田駅が赤,東京都の駅が青,神奈川の駅が緑になっている.
このコミュニティに含まれる東京都と神奈川県の駅の個数は以下.
駅数 | |
---|---|
東京都 | 66 |
神奈川県 | 88 |
つまり町田は神奈川の駅が多く含むコミュニティに属しているため,町田は神奈川であることがわかった.
ちなみにコミュニティの分割の良さを評価するモジュラリティQは約0.96になった.すごい.
おわりに
在学中最後のアドベントカレンダーになります.来年以降も大学のアドベントカレンダーが立てば書きたいですね. 明日はさとり.
複雑ネットワーク×自然言語処理
本記事はFUN Advent Calendar 2017の14日目の記事です.
昨日は@n_atmark君でした.
自己紹介
本記事では
最近,複雑ネットワークと何かの分野を組み合わせる研究が注目されています. そこで,本記事では私の研究の話も入れつつ複雑ネットワークがどんなものかを簡単に紹介し,NLPにどう使うのかについて執筆しようと思います.
以下,常体で記述します.
複雑ネットワークとは
複雑ネットワークには2種類ある.
- スケールフリー・ネットワーク
- スモールワールド・ネットワーク
スケールフリー・ネットワークは次数分布がベキ則になっているネットワークである.つまり,両対数プロットをすると直線になる.例えばWikipediaでは,記事をノード,他の記事へのリンクをエッジにするとベキ則に従っていることが知られている.
一方,スモールワールド・ネットワークは六次の隔たりのように,小さい平均距離と高いクラスター性*1をもつものである.
キーワード抽出
本記事では,Wikipediaの未来大の本文を解析し,キーワード抽出(名詞)を行ってみる.
比較手法として,キーワード抽出によく用いられているを使う.今回は1つの文書しか用いないので,はWikipediaの記事全てから求めておく.以下の表は値が大きい順に並べている.
1 | 設計 | 複雑系 |
2 | 領域 | 公立大学 |
3 | コース | 知能 |
4 | 学科 | 山本理顕 |
5 | 公立大学 | 領域 |
6 | 複雑系 | 設計 |
7 | 大学院 | 学長 |
8 | 4月 | 情報アーキテクチャ |
9 | 設置 | 公立はこだて未来大学 |
10 | 知能 | 学科 |
複雑ネットワーク
さて,ここから複雑ネットワークを用いてキーワード抽出を行う.ここでは,手法について全て述べると,事前知識がかなり必要になるので簡単に述べる.
ノードは本文中にある名詞でいいのだが,エッジの張り方には工夫がいる.例えば「同一文中に含まれる名詞どうしを共起しているとみなしてエッジを張る」という方法もあるのだが,これは解析する文量によってはエッジが多すぎて解析しにくい.
そこで,Jaccard係数やSimpson係数などの共起指標の登場である(今回はJaccard係数を用いる).これを用いることにより,単語どうしの共起度合いがわかるので,値の高いものにエッジを張ることで,重要な単語どうしにのみエッジが張られる.
そうして得られた共起ネットワークに対して複雑ネットワーク的な解析を行い,ネットワークの中で貢献度(Contribution)が高いノード(名詞)をキーワードとして抽出し,を掛けてみる.結果は以下のようになった.
1 | システム | システム |
2 | 設計 | 設計 |
3 | 学科 | 学科 |
4 | 領域 | 領域 |
5 | コース | 複雑系 |
6 | 複雑系 | コース |
7 | 知能 | 知能 |
8 | 公立大学 | 公立大学 |
9 | 4月 | 情報アーキテクチャ |
10 | 函館市 | 情報科学部 |
選定された名詞はと比べて良い感じに見えるが,劇的に変わったようには見えない.すると「わざわざ共起ネットワークなんて作らなくてもいいじゃん!計算量も多いし!」っていう話になる.
このキーワード抽出法がよりも優れている点は,複数文書に対応可能であることである.は''その文書''のキーワードを抽出する技術なので,複数文書ではそのまま適用できない.
一方,共起ネットワークを作る手法では,Jaccard係数などの共起指標を用いているので,文書が増えれば増えるほど,単語Aと単語Bがどの程度共起するのかが分かってくる.経験としては,共起ネットワークを使った場合は一般的な単語が抽出され,当然であるがは専門用語が抽出されやすい.
おわりに
複雑ネットワークと自然言語処理をどう組み合わせるのかについて執筆しました.詳しい手法について説明していないのはご容赦願います.こういうことやってるんだよ〜という話がしたかっただけです.
複雑ネットワークに興味が出ましたら,何かの分野と掛け合わせてみると面白い結果が出てくると思います.
*1:ネットワークの密な度合い