python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn't work - Stack Overflow

IT技术

更新时间：2025-01-128

admin管理员组
文章数量:1126317

I am trying to read AWS S3 bucket with pyspark. The bucket requires requester to pay to read.

However, it doesn't seem to work although the similar credentials on aws-cli works and the reason that I believe spark.hadoop.fs.s3a.requester-pays.enabled config is the reason is because if I remove the parameter --request-payer requester on aws-cli I get the exactly same error.

Below is my code for pyspark configuration

spark = SparkSession.builder  \
    .appName("MainnetBlocksStreamingJob") \
    .config("spark.jars.packages", "org.apache.hadoop:hadoop-aws:3.2.0,com.amazonaws:aws-java-sdk-bundle:1.11.375") \
    .config("spark.hadoop.fs.s3a.access.key", S3_ACCESS_KEY) \
    .config("spark.hadoop.fs.s3a.secret.key", S3_SECRET_KEY) \
    .config("spark.hadoop.fs.s3a.endpoint", "s3.amazonaws") \
    .config("spark.hadoop.fs.s3a.impl", "org.apache.hadoop.fs.s3a.S3AFileSystem") \
    .config("spark.hadoop.fs.s3a.path.style.access", "true") \
    .config("spark.hadoop.fs.s3a.requester-pays.enabled", "true") \
    .config("spark.hadoop.fs.s3a.requester.pays.enabled", "true") \
    .config('spark.hadoop.fs.s3a.aws.credentials.provider', 'org.apache.hadoop.fs.s3a.SimpleAWSCredentialsProvider')\
    .getOrCreate()

And I running pyspark with the command

spark-submit \--packages io.delta:delta-spark_2.12:3.3.0,org.apache.hadoop:hadoop-aws:3.2.0,com.amazonaws:aws-java-sdk-bundle:1.11.375 \
--conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=file:log4j.properties" \
--conf spark.hadoop.fs.s3a.requester-pays.enabled=true \
dataproc_jobs/streaming.py

Thank you.

本文标签： pythonpySpark Hadoop AWS s3 requesterpaysenabled config doesn39t workStack Overflow

版权声明：本文标题：python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn't work - Stack Overflow 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.betaflare.com/web/1736641216a1945997.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

编程频道|软件玩家 - 软件改变生活！

python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn't work - Stack Overflow

更多相关文章

python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn't work - Stack Overflow

发表评论

推荐文章

node.js - node jsmongodb: Update document while looping objectarray - Stack Overflow

php - Get check box values inside array for use in posting form data

C# WPF Window shows nothing after Hide() - Stack Overflow

customization - How to include own css on wordpress tinymce editor?

How to disable JavaScript in Chrome Developer Tools? - Stack Overflow

热门文章

Does Mutation Response Data Count As Query Points in GitHub GraphQL API? - Stack Overflow

datepicker - Change date picker type (Sliced Invoices)

azure - Scraping audit logs from storage accounts - Stack Overflow

Custom Post Type Pagination Showing 404 On archive pages

Make comment textarea input un-required

Update user meta via REST API?

javascript - Getting the ID of the element that fired an event - Stack Overflow

Showing the Dynamic Filter Data to Last Row on Front Page [excel, formula] - Stack Overflow

typescript - Error generating PDF: invalid distance too far back when using drawText from pdf-lib - Stack Overflow

python - Flask is closing https connections even after setting WSGIRequestHandler.protocol_version to http1.1 - Stack Overflow

最新文章

Java入门级教学（IDEA的下载与安装与JDK的环境配置）

华硕笔记本电脑用U盘重装windows系统

物理网卡MAC修改器v3.0 - 真实网卡硬件MAC地址修改，重装系统不变！

如何一键安装win7系统(一键安装win7系统步骤)

Windows 11最稳定版本详解

javascript - HTML table with fixed headers? - Stack Overflow

How to disable core and plugin updates

c# - How to handle WCF Json deserialization to List<object> then casting that object to different types? - Stack O

javascript - How to set DOM element as first child? - Stack Overflow

How to send an email from JavaScript - Stack Overflow

惠普OMEN 15-CE001TX 2EF91PA参数报价

苹果新款MacBook Pro 15英寸 i732GB1TBVega Pro 20参数报价

联想Y330A-PSE L参数报价

神舟战神Z7 D6 i7-12650H16GB512GBRTX4050旗舰版参数报价

神舟战神Z7 D6 i7-12650H16GB1TBRTX4050参数报价

编程频道|软件玩家 - 软件改变生活！

python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn&#39;t work - Stack Overflow

更多相关文章

python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn&#39;t work - Stack Overflow

发表评论

推荐文章

node.js - node jsmongodb: Update document while looping objectarray - Stack Overflow

php - Get check box values inside array for use in posting form data

C# WPF Window shows nothing after Hide() - Stack Overflow

customization - How to include own css on wordpress tinymce editor?

How to disable JavaScript in Chrome Developer Tools? - Stack Overflow

热门文章

Does Mutation Response Data Count As Query Points in GitHub GraphQL API? - Stack Overflow

datepicker - Change date picker type (Sliced Invoices)

azure - Scraping audit logs from storage accounts - Stack Overflow

Custom Post Type Pagination Showing 404 On archive pages

Make comment textarea input un-required

Update user meta via REST API?

javascript - Getting the ID of the element that fired an event - Stack Overflow

Showing the Dynamic Filter Data to Last Row on Front Page [excel, formula] - Stack Overflow

typescript - Error generating PDF: invalid distance too far back when using drawText from pdf-lib - Stack Overflow

python - Flask is closing https connections even after setting WSGIRequestHandler.protocol_version to http1.1 - Stack Overflow

最新文章

Java入门级教学（IDEA的下载与安装与JDK的环境配置）

华硕笔记本电脑用U盘重装windows系统

物理网卡MAC修改器v3.0 - 真实网卡硬件MAC地址修改，重装系统不变！

如何一键安装win7系统(一键安装win7系统步骤)

Windows 11最稳定版本详解

javascript - HTML table with fixed headers? - Stack Overflow

How to disable core and plugin updates

c# - How to handle WCF Json deserialization to List&lt;object&gt; then casting that object to different types? - Stack O

javascript - How to set DOM element as first child? - Stack Overflow

How to send an email from JavaScript - Stack Overflow

惠普OMEN 15-CE001TX 2EF91PA参数报价

苹果新款MacBook Pro 15英寸 i732GB1TBVega Pro 20参数报价

联想Y330A-PSE L参数报价

神舟战神Z7 D6 i7-12650H16GB512GBRTX4050旗舰版参数报价

神舟战神Z7 D6 i7-12650H16GB1TBRTX4050参数报价

python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn't work - Stack Overflow

python - pySpark Hadoop AWS s3 requester-pays.enabled config doesn't work - Stack Overflow

c# - How to handle WCF Json deserialization to List<object> then casting that object to different types? - Stack O