ggeasyRパッケージでより簡単なggplot

ggplot2データ視覚化Rパッケージは、非常に強力で柔軟性があります。ただし、特に頻繁に使用するユーザーでない場合は、すべてのタスクの実行方法を覚えておくのは必ずしも簡単ではありません。グラフタイトルのサイズをどのように変更しますか?凡例のタイトルを削除するにはどうすればよいですか?私の通常の解決策は、覚えにくいもののためにRStudioコードスニペットを保存することです。しかし、役立つパッケージもあります:ggeasy。

あるいは少なくともEASI -名前が言うように、ggeasyの目標は、よく、簡単ggplot2ようにすることですえー。これには、主にテキストと軸の書式設定を中心とした、一般的なタスクのより直感的な機能であると感じる人がいるかもしれません。(このパッケージは、線、点、棒の外観と動作には影響しません)。すべてのggeasy関数はで始まるeasy_ので、RStudioオートコンプリートを使用して簡単に見つけることができます。上のビデオでそれがどのように機能するかを見ることができます。

以下の私の例を実行したい場合は、ggeasyがCRANにあるので、を使用してインストールできますinstall.packages("ggeasy")。また、ggplot2(当然)、dplyr、rio、およびlubridateパッケージも使用します。後で、複数のグラフを非常に簡単に配置するためのパッチワークパッケージを追加します。それはCRANにもあります。

この例では、最近ほとんどの人が考えているコロナウイルスに関するデータを使用します。コロナウイルス追跡プロジェクトから米国の州ごとのデータを含むCSVファイルをダウンロードできます。

download.file( "// covidtracking.com/api/states/daily.csv"、

destfile = "covid19.csv")

(あなたは名前を付けることができdestfile私が使用していました。あなたが希望先のファイルは何も)rio::import()データをインポートすることができますが、使用することもできreadr::read_csv()read.csv()data.table::fread()CSVをインポートする、または任意の他の機能を。

rioでは、日付は整数として入力されたため、lubridateのymd()関数を使用してその列をDateオブジェクトに変換します。

data $ date <-lubridate :: ymd(data $ date)

理解するのがそれほど難しくないグラフを作成するために、このデータをいくつかの状態でフィルタリングして、50の個別の時系列線がないようにします。ルイジアナ州知事は、ルイジアナ州が世界で最も急成長している事件の1つであると述べました。(2月のマルディグラがニューオーリンズでクラスターを引き起こしたのではないかとの推測があります。)私はルイジアナに拠点を置いているので、ルイジアナよりも約50パーセント多い州であるマサチューセッツも追加します。

データをフィルタリングした後、データの基本的な折れ線グラフを作成します。

States2 <-filter(data、state%in%c( "LA"、 "MA"))

ggplot(states2、aes(x =日付、y =正、色=状態))+

geom_line()+

geom_point()+

theme_minimal()+

ggtitle( "ルイジアナ&マサチューセッツデイリーコビッド-19件")

シャロン・マクリス、

それはかなり急な増加です。その一部は、テストの増加が原因である可能性があります。テストが増加したため、より多くのケースについて知っているだけかもしれません。これについては後ほど説明します。

最初に、しかし、このグラフにいくつかの調整はどうですか?

グラフのタイトルを大きくすることから始めましょう。ggeasyを使用するにeasy_ は、RStudioの左上のソースペインに入力を開始し、必要なものが見つかるまでスクロールします。 

シャロン・マクリス、

easy_plot_title_size()私が必要とする機能のように見えます。このコードでグラフのタイトルを16ポイントタイプに変更できます。

ggplot(states2、aes(x =日付、y =正、色=状態))+

geom_line()+

geom_point()+

theme_minimal()+

ggtitle( "Lousiana&Massachusetts Daily Covid-19ケース")+

easy_plot_title_size(16)

x軸のテキストをeasy_rotate_x_labels(90)90度回転させて回転させ、凡例のタイトル(これらが状態であることは明らかeasy_remove_legend_title()です)を。で削除できます。グラフをと呼ばれる変数に格納することを含む、完全なグラフコードを以下に示しますpositives

ポジティブ<-ggplot(states2、aes(x = date、y = positive、color = state))+

geom_line()+

geom_point()+

theme_minimal()+

ggtitle( "Lousiana&Massachusetts Daily Covid-19ケース")+

easy_plot_title_size(16)+

easy_rotate_x_labels(90)+

easy_remove_legend_title()

シャロン・マクリス、

次に、コロナウイルスの陰性結果を調べて、陽性と同様の割合で上昇しているかどうかを確認したいと思います。同じコードを使用しますが、y列を負に切り替えるだけです。

ネガティブ<-ggplot(states2、aes(x = date、y = negative、color = state))+

geom_line()+

geom_point()+

theme_minimal()+

ggtitle( "Lousiana&Massachusetts Negatives")+

easy_plot_title_size(16)+

easy_rotate_x_labels(90)+

easy_remove_x_axis( "title")+

easy_remove_y_axis( "title")+

easy_remove_legend_title()

シャロン・マクリス、

ルイジアナでは、ネガティブよりもポジティブの方が大きく上昇しているようです。それがテスト基準が変わったからなのか、それとも何か他のものなのかはわかりませんが。

これらの2つのグラフを並べて表示すると便利です。そこでパッチワークパッケージが登場します。 

これらの2行のコードだけで、最初にパッチワークパッケージをロードします。 

ライブラリ( "パッチワーク")

ポジティブ+ネガティブ

私はこれを得る:

シャロン・マクリス、

パッチワークを使用して複数のグラフを配置するのは非常に簡単です。レイアウトをカスタマイズする方法の詳細については、パッチワークのWebサイトにアクセスしてください。

これで、戻ってggeasyを使用して凡例の1つを削除し、2つがないようにしてから、パッチワークを再実行できます。

ネガティブ<-ネガティブ+

easy_remove_legend()

ポジティブ+ネガティブ

明らかに、ggeasyは、いくつかの迅速で簡単なデータ探索に非常に役立ちます。

Rに関するその他のヒントについては、の「Do More With R」ページにアクセスするか、「Do MoreWithR」YouTubeプレイリストをご覧ください。