GTLの軸設定を極める(1) 軸タイプを使い分ける

f:id:supermanJP:20200512001448j:plain

グラフを希望通りに作成するためには軸の設定方法を理解することはとても大事です。設定項目は多いので実務でとくにおぼえておいたほうがいい部分だけを複数回紹介します。

GTLでは4つの軸タイプがあり、作図によって使い分ける必要があります。

続きを読む

GTLで罫線を作成する Drawlineステートメント

Drawステートメントは前回の記事でも言及した通り、実用的な使用例はあまりありませんが、Drawlineステートメントはグラフ内の罫線を引くのに有用です。 Drawlineステートメントだけでは罫線を引く位置を定義しずらいですが、Layout latticeと併用することで罫線の位置を厳密に指定することができます。

続きを読む

SASのクソな部分をぶった切る!(6)proc DS2の活用例を探す旅

前回の記事でproc ds2がいらない子扱いしていたところ、一応使っている人もいるらしく一概に役に立たないとはいえないとも意見が来たので、 もう少しds2を触ってみて、なんとか活躍できる場所がないか検討してみました。

せっかく生まれてきたんだもんね・・・ずいぶん大きくなったし・・・活躍・・・したいよね・・・

続きを読む

SASのクソな部分をぶった切るシリーズの反響について

これまでSASの欠点を焦点に展開してきた「SASのクソな部分をぶった切る!」シリーズですが、なぜか一部の方に反響がありまして、 いくつか意見をいただいたのでいくつか追加コメントを残しておきます。

一部の記事は追記する予定です。ご意見が来るたびにこの記事も更新します。

続きを読む

SASで使える!実用データクリーニングテクニック

f:id:supermanJP:20200524152545p:plain

SASに限らずデータクリーニングや前処理はデータ分析の分野では必須の工程であり、おそらく今後も人の手で実施しなくてはならない分野です。

個人的には機械学習のライブラリとかよりもはるかに習得優先度が高いと思います。

SASを使ったデータクリーニング方法って案外共有されていない印象だったのでメモしておきます。

データクリーニングテクニックとはいっても、どのデータがおかしいかを検出するのが全てですので、データクリーニングは想定外データの検出する工程とも言えます。 検出できればあとは該当データを修正、削除をすればよいわけです。

続きを読む

SASで正規表現を利用する

f:id:supermanJP:20200524152545p:plain

私はデータチェックの時に正規表現を利用することがありますが、同僚はあまり使っていないらしく、後輩は正規表現自体を知らないとのことだったので、正規表現についてメモを残しておくことにしました。 正規表現はそれだけで分厚い解説書が出来上がるくらい奥が深いものですが、実務上ではそこまで複雑な正規表現パターンは使わないと思うので、頻出のものだけを覚えておくだけで十分かなと思います。

続きを読む