Ledge Tech Blog

We're the data scientists and AI engineers behind Ledge.

Azure Speech to Textを使って面倒な文字起こしの作業時間を90%以上削減した話

こんにちは。レッジでデータサイエンティストをしている今村です。 今回は社内における業務効率化の取り組みの1つとして、音声文字起こしツールの開発秘話について紹介します。 音声文字起こしツールを活用することで、6時間程度かかっていた文字起こし作業…

GCP Cloud Functionsを使用して新チャンネル作成通知Slack Appを作る方法

こんにちは。レッジインターン生の大熊です。 今回はSlackで誰かが新しいチャンネルを作成したときに通知するAppを、Google Cloud Functions(以下Cloud Functions)を通じて作成する方法をご紹介します。 弊社ではSlack上で誰かが新しいチャンネルを作成する…

【Tableau】 Workout Wedesday 2021W2を解いてみた

こんにちは。レッジインターン生の大熊です。第2回目はWorkout Wednesday2021 Week2について解説していきます。今回のお題は「Can you build a Customer Lifetime Value Matrix?」というもので、以下のコホート図のようなダッシュボードを作成するのが目標で…

【Tableau】 Workout Wedesday 2021W1を解いてみた

今回から不定期ですが、Workout Wednesdayの解説を紹介していきます。記念すべき第1回目はWorkout Wednesday2021 Week1について解説していきます。

「TableauでExcelっぽい棒グラフを作成してくれないか」と上司に言われたときの2つの対処法

今回はExcelっぽい幅の狭い棒グラフをTableauで作成する方法を、画像付きで2種類ご紹介します。

合成データがモデル構築をよりオープンにする〜MLタスクでのSDVによる合成データの有効性を検証する

こんにちは。レッジのデータサイエンティストの松本です。 レッジでは、クライアント先に常駐してデータ・ドリブンな課題解決に取り組んだり、ダイナミックプライシングやNLP周りのアルゴリズムを受託開発したり、クライアント先へのBI導入の推進など、幅広…

「Pythonで動かして学ぶ!深層学習の教科書」を読んでPythonの勉強をしてみた

こんにちは。初めまして。レッジのインターン生の大見川です。 レッジでは、 データサイエンス部門に所属していますが、 Ledge.ai でも記事を書いているので良ければご覧ください。 今回の記事では、「Pythonで機械学習の実装をしてみたい!」という方に向け…

分類問題の予測結果の評価指標(Accuracy, Precision, Recall, F値, AUC)について整理してみた

こんにちは。レッジインターン生の大熊です。 今回は分類問題のタスクにおける予測結果の評価指標について、代表的なものをピックアップして書いていきます。 評価指標は各タスクに合わせて設定しなければならず、またその評価値の閾値も個別に設定すること…

Streamlit Sharingを使ってWebアプリを爆速でデプロイしてみた

こんにちは。レッジでデータサイエンティストをしている今村です。 WebアプリケーションフレームワークであるStreamlitからWebアプリを簡単にデプロイできるStreamlit Sharingが発表されました。今回はStreamlit Sharingを実際に試してみたので、実際のデプ…

セミパラメトリックな差分の差推定をPythonで実装してみた

本記事ではサンプルデータとPythonを用いて、傾向スコアを使用したセミパラメトリックな差分の差推定を行ってみました。

因果推論に入門したので二重にロバストな推定量をPythonで実装してみた

本稿では傾向スコアを使用して因果効果を推定する方法の1つである、二重にロバスト(DR:Doubly Robust)な推定法をPythonで実装していきます。DR推定量はIPWと回帰分析を組み合わせたものであり、それぞれ単独の推定よりも良い推定を行うことを目指した手法…

はてなブログのSNSリアクション数を自動で取得して可視化する方法

こんにちは。レッジのデータサイエンティストの松本です。 レッジでは、クライアント先に常駐してデータ・ドリブンな課題解決に取り組んだり、ダイナミックプライシングアルゴリズムを受託開発したり、クライアント先へのBI導入の推進など、幅広くデータ利活…

Streamlitでポケモンを生成するGANを用いたWebアプリを作ってみた

こんにちは。レッジでデータサイエンティストをしている今村と申します。 レッジでは機械学習モデルの構築といったエンジニア色強めの業務や、クライアントへの提案といった上流工程など、AIプロジェクトにおける上流から下流まで広く関わらせていただいてい…

StreamlitでベイジアンABテストができるWebアプリを作成してみた

こんにちは。レッジのデータサイエンティストの松本です。今回が3回目の投稿になります。 レッジでは、クライアント先に常駐してデータ・ドリブンな課題解決に取り組んだり、ダイナミックプライシングアルゴリズムを受託開発したり、クライアント先へのBI導…

自動運転やロボットで使われる点群データとは?そして自動運転は何が難しいのか?

こんにちは。レッジのエンジニアの山岡です。 レッジではエンジニアではありつつも、クライアントとの商談に出させてもらう機会が増えてきて、コードを書くよりも提案や提案に向けた調査をすることが多いです。 業務の流れとしては、クライアントからの相談…

新人が「ビッグデータを支える技術」を読んでみた

こんにちは。初めまして。レッジのユンです。レッジでは、データ・ドリブンなビジネス上の意思決定を導くため、データウェアハウス(DWH)作成やデータマート作成など、主にデータを整備する業務に取り組んでいます。 今回の記事では、私が最近読んだ「ビッ…

新型コロナの影響で今年のインフルエンザ感染者数はどれくらい減ったのかを検証してみた

こんにちは。レッジのデータサイエンティストの松本です。今回が2回目の投稿になります。 レッジでは、クライアント先に常駐してデータ・ドリブンな課題解決に取り組んだり、ダイナミックプライシングアルゴリズムを受託開発したり、クライアント先へのBI導…

Pythonでマルチエージェントシミュレーションに入門してみた

コロナの感染拡大に際して、マルチエージェントシミュレーション(MAS)という手法が最近注目されています。本記事では、「マルチエージェントって言葉はなんとなく聞いたことがあるけれど、いまいちよくわかっていない」という方に向けて、その概要・適用例…

Tableauをデータリテラシーが高くない現場に導入して使い倒してもらうコツ

こんにちは。レッジのデータサイエンティストの松本です。 レッジでは、クライアント先に常駐してデータ・ドリブンな課題解決に取り組んだり、ダイナミックプライシングアルゴリズムを受託開発したり、クライアント先へのBI導入の推進など、幅広くデータ利活…

Ledge Tech Blogはじめました

こんにちは、株式会社レッジです! 本日より、弊社に所属するデータサイエンティスト、エンジニア、マーケターによるTech Blogをスタートいたします。 初回ということで、少しだけ弊社の紹介をさせてください! 株式会社レッジは、 「突出した情報と企画力で…