Data.tableに関する最新の質問

1
答える

Rパイプ、mget、および環境

誰かがここでの動作を説明できることを期待して、これを投稿しています。また、これにより、同様のエラーを修正する方法を追跡する時間を節約できる可能性があります。

data.table r mget magrittr

0
答える

R:データ圧縮[クローズ]

終了しました。この質問はStack Overflow guidelinesに適合しません。現在、回答を受け付けていません。 この質問を改善しますか?質問を更新してATAG-1にします|スタックオーバーフローの場合。

compression r fread data.table

1
答える

RData.Tableを使用して1日あたりの平均を見つける[重複]

この質問にはすでに回答があります: Calculate the mean by group (4つの答え) 閉鎖3日前。 この質問にはすでに回答がありますこの質問にはすでに回答があります: Calculate the mean by groupグループごとの平均を計算する (4つの答え) (4つの答え) 3日前3日前に閉鎖されました。 私のdf次のようになります:

data.table r

2
答え

rの列間で一致する値の上位パーセントを選択するにはどうすればよいですか?

遺伝子のデータセットがあり、遺伝子が病気を引き起こす可能性があるかどうかを予測するいくつかのモデルを比較しました。私が調べているすべての機械学習方法で、最も可能性の高い病気の原因となる遺伝子の上位25%に現れる遺伝子を選択しようとしています。したがって、すべてのモデルが同意する可能性のある疾患遺伝子の上位パーセントを取得します。

dataframe bioinformatics r data.table

1
答える

別のデータテーブルの列として部分的なデータテーブルを合計する[重複]

この質問にはすでに回答があります: Complexe non-equi merge in R (2つの答え) 閉鎖3日前。 この質問にはすでに回答がありますこの質問にはすでに回答があります: Complexe non-equi merge in R Rでの複雑な非等価マージ (2つの答え) (2つの答え) 3日前3日前に閉鎖されました。 2つのデータテーブルがあります。 1つは時間の経過に伴うスコアを持ち、もう1つは特定の数のゲームのスコアの合計を入力したいと思います。

data.table r

2
答え

data.tableは、2つの変数によって合計を計算し、「空の」グループの観測値を追加します

悪いタイトルで申し訳ありません-私は次のことを達成しようとしています: 2つのカテゴリ変数「a」と「b」を持つdata.tabledtがあります。ご覧のとおり、aには5つの一意の値があります bには3つあります。今、例えばカテゴリ変数("a=1"と"b=3")の組み合わせはデータに含まれていません。

r data.table

1
答える

apply関数がdata.tableRスクリプトのパフォーマンスを低下させるのはなぜですか(例を示します)。

stl時系列を使用して、さまざまな場所でグループ化された1億5,000万以上の行から外れ値を識別しています。説明したように、lapply + defined関数を使用しているため、非常に遅いようです。スクリプトを実行するための再現可能な例も提供しました。スクリプトのパフォーマンスを改善するための提案や、正しく行っていないことはありますか?

function time series data.table r lapply

ホットタグ

© 2021   KonnichiwaSekai.Com