Test-Driven Data Analysis (Chapman & Hall/crc Data Science Series)

個数:
  • 予約

Test-Driven Data Analysis (Chapman & Hall/crc Data Science Series)

  • 現在予約受付中です。出版後の入荷・発送となります。
    重要:表示されている発売日は予定となり、発売が延期、中止、生産限定品で商品確保ができないなどの理由により、ご注文をお取消しさせていただく場合がございます。予めご了承ください。

    ●3Dセキュア導入とクレジットカードによるお支払いについて
  • 【入荷遅延について】
    世界情勢の影響により、海外からお取り寄せとなる洋書・洋古書の入荷が、表示している標準的な納期よりも遅延する場合がございます。
    おそれいりますが、あらかじめご了承くださいますようお願い申し上げます。
  • ◆画像の表紙や帯等は実物とは異なる場合があります。
  • ◆ウェブストアでの洋書販売価格は、弊社店舗等での販売価格とは異なります。
    また、洋書販売価格は、ご注文確定時点での日本円価格となります。
    ご注文確定後に、同じ洋書の販売価格が変動しても、それは反映されません。
  • 製本 Paperback:紙装版/ペーパーバック版/ページ数 424 p.
  • 言語 ENG
  • 商品コード 9781032896700

Full Description

Test-driven data analysis is the synthesis of ideas from test-driven development of software to data-intensive work including data science, data analysis, and data engineering. It is a methodology for improving the quality of data and of analytical pipelines and processes. It can be thought of as data analysis as if the answers actually matter.Test-driven data analysis can be thought of as a sibling to reproducible research, with similar concerns, but greater emphasis on automated testing, and less requirement for a human to reproduce results. Extensive checklists are provided that can be used to improve quality before,during, and after analysis.

Key Features:

Prevents costly errors in analytical processes before they reach production through automated data validation and reference testing of data pipelines.
• Provides actionable checklists for issues beyond the reach of automated testing.
• Equips readers with open-source Python tools and language-agnostic command-line interfaces.
• Addresses testing challenges for modern LLM-based systems including chat-bots and coding assistants.
• Instills in analysts an inner voice that is always asking: "How is this misleading data misleading me?"

Contents

Foreword Preface Acknowledgements Author 1 Orientation I Data Validation with Constraints 2 Data Validation 3 Textual Data 4 Profiling and Auditing Data 5 Constraint Discovery and Validation 6 Custom Constraints 7 Practical Considerations 8 Serial Data II Reference Testing 9 Introduction to Reference Tests 10 Modern Software Testing 11 Reference Tests for Analytical Pipelines 12 Testing Models and Modeling III Errors of Interpretation, of Process, & of Applicability 13 Errors of Interpretation I: Formulation 14 Errors of Interpretation II: Communication 15 Errors of Interpretation III: Graphing Sins 16 Errors of Process 17 Errors of Applicability and Errors of Judgement IV Appendices A The TDDA Library, Resources, & Tools B Glossary Bibliography

最近チェックした商品