タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*programとworkflowとR言語に関するsh19910711のブックマーク (5)

  • tidymodelsのrecipesパッケージがworkflowsパッケージの使用を推奨し始めた

    tidymodelsを使ったモデリングにおいて、recipesパッケージは特徴量エンジニアリングを担います。従来、recipesパッケージは単体で、特徴量抽エンジニアリング方法の 定義recipe関数 + step_*関数群学習prep関数適用bake関数(汎用)juice関数(学習データ専用)の一連の流れを担っていました。学習と適用の分割は、テストへのリークが発生対策です。標準化やPCAを行うとして、そのパラメータは学習データから決めようというわけですね。しかし、学習と適用はworkflowsパッケージに任せるのが最新式なようです。 If you are using a recipe as a preprocessor for modeling, we highly recommend that you use a workflow() instead of manually estim

    tidymodelsのrecipesパッケージがworkflowsパッケージの使用を推奨し始めた
    sh19910711
    sh19910711 2025/07/10
    2021 / "詳細な定義はrecipesやparsnipでやって、実行はworkflowsっていう流れ / tidy関数を使うとモデルの学習結果や、特徴量エンジニアリングの概要"
  • 「Rが生産性を高める〜データ分析ワークフロー効率化の実践」を読んだので感想を書く - niszetの日記

    久々のの読書感想ブログ記事 「Rが生産性を高める〜データ分析ワークフロー効率化の実践」をご恵贈いただき、1周読み終わりましたので感想を書いていきます。 読み途中の感想はツイッター上に流しているのでそちらを参照していただければ。 一般的な情報 以下、書籍情報は出版社のHPを原則として貼っていきます。必要に応じてそこから書店のサイトに飛んでください。 出版社(技術評論社)のページ gihyo.jp 同、サポートページ(エラッタ) gihyo.jp GitHub上のサポートサイト(Rのコードが各章に分かれて載っている) github.com 全体的な感想 書は中級者向けの書籍で情報・知識提供型ですが、扱っている内容は実践寄りで基的なR言語の機能を触ってみて、もう少し活用の幅を広げていきたい、という方によく合う内容となっています。ただし、分析の方法などは扱っていないので、それらを支える技術とい

    「Rが生産性を高める〜データ分析ワークフロー効率化の実践」を読んだので感想を書く - niszetの日記
    sh19910711
    sh19910711 2025/05/27
    2022 / "タイトル通り、「Rが生産性を高める」ということを体感できる / 適宜helpを見ると幅が広がり + きっかけがないとなかなかhelpを見ることってないと思うのですが、そのきっかけが随所にある"
  • {targets}でワークフローを管理せよ / Workflow management with targets

    Tokyo.R#95 https://tokyor.connpass.com/event/225967/ での発表スライド。 資料⚡️ https://github.com/uribo/talk_211030_tokyor95

    {targets}でワークフローを管理せよ / Workflow management with targets
    sh19910711
    sh19910711 2025/05/11
    2021 / "{targets}: 関数指向プログラミングと宣言型のワークフローが特徴 + {drake}パッケージの後継 / Stanなどの実行に時間を要する処理や機械学習の実験に適する"
  • R のパッケージ {targets} にコントリビュートした話 - Sansan Tech Blog

    はじめに 研究開発部の小松です。 記事は Sansan Advent Calendar 2022 の17日目の記事になります。 adventar.org 普段こちらのブログではネットワーク経済学をテーマに細々と書いています。今回は少し話題を変えて、日頃の分析でお世話になっている R のパッケージ {targets} に (半年ぐらい前になりますけれど) OSSコントリビュートした話をします。 普段の業務では Python と R 両方使っていますが、素早い対応が求められる分析業務では私は R を使っています。{tidyverse} によるデータハンドリングに慣れた身からすると、pandas での処理はまどろっこしく感じられて未だに慣れません。*1 その R を用いた分析の生産性を向上に大きく寄与しているのが、1年程前に使い始めた {targets} です。以下の記事にも、研究開発部の R

    R のパッケージ {targets} にコントリビュートした話 - Sansan Tech Blog
    sh19910711
    sh19910711 2022/12/28
    クラウドストレージの連携良さそうだな / "{targets}: パイプラインの依存関係を記録し、変更が加えられたときに必要な計算のみを実行 / キャッシュファイルの保存先として、AWS S3 や GCP Cloud Storage を指定することが可能"
  • Rユーザーのためのmake入門 | gihyo.jp

    稿では「Rユーザーのためのmake入門」と題して、makeというビルドツールを紹介します。makeはRに限らずさまざまなプロジェクトで汎用的に使われており、使い慣れておくと日常のコマンド実行を効率化できるかもしれません。 今回はMakefileの基的な書き方から、複数のRmdファイルをmakeを使って一括で変換する例を紹介します。締切直前に複数のRmdファイルを編集していたとしても、確実にすべてのレポートをコマンド1発で最新にできるようになるでしょう。 makeはすでにお使いの環境にインストール済みかもしれませんし、インストールされていなかったとしても、パッケージマネージャなどで簡単にインストールできるでしょう。稿では再現性のため、Docker上でRStudioやmakeを動かします。動作確認はrocker/tidyverse:4.2.1で行っています。 以下を実行して、RStudi

    Rユーザーのためのmake入門 | gihyo.jp
    sh19910711
    sh19910711 2022/11/12
    "makeにはパターンルールというしくみがあります。パターンルールはターゲットの指定に% / $<という見慣れない記号が現れました。これは自動変数と呼ばれるもののひとつで、ソースファイルの名前に置換されます"
  • 1