銀行員 RとPythonに出会う

Rネタを中心に、いろいろと更新していきます

2018-01-01から1年間の記事一覧

Shiny Tips / dygraphsパッケージ

RのShinyパッケージのTipsです。たまに更新していきたいと思います。 以下は、私が日ごろよく見るサイトです。 Shinyの情報は英語のサイトではたくさん出るのですが、日本語で読める情報ソースはそう多くないので大変参考になります。 www.randpy.tokyo dygr…

決定係数の導出をおさらい

備忘的にメモ。 平方和の分解 回帰直線を用いるとき、応答変数(目的変数)の変動の大きさを表す平方和は、回帰による平方和と残差平方和の和の形に分解できる。 観測値の平方和の式を変形すると となる。 ここで、右辺第3項は予測値と残差の偏差積和を表すが…

Translation

今回は最近の取り組みを紹介します。 Software Carpentryという、研究者(リサーチャー)向けにRやPythonいったプラグラミング言語による分析スキルを教えているボランティアの日本語化プロジェクトにアサインしています。 software-carpentry.org RやPythonに…

状態空間モデルの簡単な備忘とAIのイメージ

最近は業務で時系列分析の比重が高まりつつあったため、いくつか時系列分析(特に状態空間モデル)の書籍を読んでいました。 基本的な計量経済学系の時系列モデルは学んだことがありますが(キレイに忘れてましたが。。。)、今回の業務の目的に合わせて状態空間…

AIC

今日は理論の話 最近、この本を読み直しています。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥 出版社/メーカー: 岩波書店 発売日: 2012/05/19 メディア: 単行本 購入: 16人 クリ…

Juliaを試す

Juliaについて Juliaはプログラミング言語の一種です。 特徴を一言でいうと「処理が速い、わかりやすい」だそうです。 2009年から開発が始まった言語(ようするに開発途上)でバージョンも0系だったのですが、8月にバージョン1.0系がリリースされたとのこと…

RESAS

最近興味を持ったこと。 contest.resas-portal.go.jp RESASは、一言でいうと官民ビッグデータがいろいろと収納された可視化ツールです。地方創生に向けた施策の一つで、自治体が客観的なデータに基づく形で地域の現状や課題を把握できるようにすることを意図…

~続・不動産とファイナンス・賃貸物件入居者編(3)~「機械学習を使って東京23区のお買い得賃貸物件を探してみた」を千葉県で再度やってみる(予測編)

今回は、不動産賃貸物件の賃料予測シリーズの最終回です。 (分析のソースコードは最後に一括掲載します) データクレンジングした千葉県の賃貸物件情報データセットを使って、予測に入っていきます。 その前に、データクレンジングについて補足があります。 …

~続・不動産とファイナンス・賃貸物件入居者編(2)~「機械学習を使って東京23区のお買い得賃貸物件を探してみた」を千葉県で再度やってみる(データクレンジング編)

今回は前回記事の続きで、SUUMOから取得してきたデータのクレンジングを行います。 d-s.hatenablog.com なお、このテーマはshokosakaさんの記事が参考となっています。 www.analyze-world.com 参考記事ではPythonでデータクレンジング(前処理)を行っています…

~続・不動産とファイナンス・賃貸物件入居者編(1)~「機械学習を使って東京23区のお買い得賃貸物件を探してみた」を千葉県で再度やってみる(Rでスクレイピング)

前回の記事で、千葉県の賃貸物件の賃料予測を実行するところまで行いました。 d-s.hatenablog.com しかし、データ取得のところで課題がいくつかあったため、今回データ取得(スクレイピング)のやり直しです。 コードはまとめて最下部に記載します。 前回はs…

Rの【woeBinning】パッケージ がとても便利

分類問題をロジスティック回帰で予測しようと思ったらこのパッケージが便利そうです。 説明変数をWOE(Weight ou Evidence)ベースでビン化してIV(Information Value) を算出してくれます。 「WOE」というよりクレジットスコアリングモデルの説明ですが、以下…

~不動産とファイナンス・賃貸物件入居者編(2)~「機械学習を使って東京23区のお買い得賃貸物件を探してみた」を千葉県でやってみる

今回は前回の続きをやっていきます。 引き続き参考はこちらです。 www.analyze-world.com 参考のままですが、コードは追記しておきました。 では、まず前回見ていなかった築年数から見ていきます。 市川、浦安という東京(江戸川区)の隣接地域の築年数が高…

~不動産とファイナンス・賃貸物件入居者編(1)~「機械学習を使って東京23区のお買い得賃貸物件を探してみた」を千葉県でやってみる

今回は前々回の記事で触れた通り、以下のエントリを参考に千葉県のお買い得賃貸物件を分析して探してみます。 shokosakaさんのブログですが、大変勉強になりました。 このブログをなぞる形で進めてみます。 www.analyze-world.com その前に、ブログを始めて…

Rと効率的フロンティアとCAPM(2)

前回の続きです。 早速効率的フロンティアを描いてみます。 dt2 <- dt[,c(1,2,5)] %>% na.omit() %>% tidyr::spread(ticker, ret) %>% select(2,3,4) # 期待リターン(平均)の算出 er_x <- mean(dt2$SOFTBANK) er_y <- mean(dt2$TAKEDA) er_z <- mean(dt2$T…

Rと効率的フロンティアとCAPM(1)

ブログを始めたものの、さっそくネタ探しにやっきになってます。 いろいろ探索していると以下のような面白いエントリーが。 。。www.analyze-world.com smrmkt.hatenablog.jp www.analyze-world.com おお! まさにこんな分析をやってみたかったんです。 上に…