python - Why am I getting "raise source.error("multiple repeat", re.error: multiple repeat at positio

IT技术

更新时间：2025-03-161

admin管理员组
文章数量:1320647

The code is attached below. It works fine until it gets to ai: df_ai in the database dict.

data = pd.read_csv('survey_results_public.csv')

df_demographics = data[['ResponseId', 'MainBranch', 'Age', 'Employment', 'EdLevel', 'YearsCode', 'Country']]

df_learn_code = data[['ResponseId', 'LearnCode']]

df_language = data[['ResponseId', 'LanguageAdmired']]

df_ai = data[['ResponseId', 'AISelect', 'AISent', 'AIAcc', 'AIComplex', 'AIThreat', 'AIBen', 'AIToolCurrently Using']]

database = {'demographics': df_demographics, 'learn_code': df_learn_code, 'language': df_language, 'ai': df_ai}

def find_semicolons(dataframe):
    result = []

    firstFifty = dataframe.head(50)

    for column in firstFifty.columns:
        if firstFifty[column].apply(lambda x: ';' in str(x)).any():
            result.append(column)

    return result


def transform_dataframe(dataframe):
    result = find_semicolons(dataframe)

    for column in result:
        values = [str(x).split(';') for x in dataframe[column].unique().tolist()]
        flat_values = []
        for x in values:
            flat_values.extend(x)
        flat_values = set(flat_values)
        for x in flat_values:
            dataframe[x] = dataframe[column].str.contains(x, na=False).astype(int)



for x in database:
    transform_dataframe(database.get(x))
    database.get(x).to_csv(x + '.csv')

Here's the traceback

Traceback (most recent call last):
  File "/Users/shalim/PycharmProjects/work/stackoverflow.py", line 45, in <module>
    transform_dataframe(database.get(x))
  File "/Users/shalim/PycharmProjects/work/stackoverflow.py", line 40, in transform_dataframe
    dataframe[x] = dataframe[column].str.contains(x, na=False).astype(int)
  File "/Users/shalim/PycharmProjects/work/venv/lib/python3.9/site-packages/pandas/core/strings/accessor.py", line 137, in wrapper
    return func(self, *args, **kwargs)
  File "/Users/shalim/PycharmProjects/work/venv/lib/python3.9/site-packages/pandas/core/strings/accessor.py", line 1327, in contains
    if regex and repile(pat).groups:
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/re.py", line 252, in compile
    return _compile(pattern, flags)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/re.py", line 304, in _compile
    p = sre_compilepile(pattern, flags)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_parse.py", line 948, in parse
    p = _parse_sub(source, state, flags & SRE_FLAG_VERBOSE, 0)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_parse.py", line 443, in _parse_sub
    itemsappend(_parse(source, state, verbose, nested + 1,
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_parse.py", line 671, in _parse
    raise source.error("multiple repeat",
re.error: multiple repeat at position 2

The code is attached below. It works fine until it gets to ai: df_ai in the database dict.

data = pd.read_csv('survey_results_public.csv')

df_demographics = data[['ResponseId', 'MainBranch', 'Age', 'Employment', 'EdLevel', 'YearsCode', 'Country']]

df_learn_code = data[['ResponseId', 'LearnCode']]

df_language = data[['ResponseId', 'LanguageAdmired']]

df_ai = data[['ResponseId', 'AISelect', 'AISent', 'AIAcc', 'AIComplex', 'AIThreat', 'AIBen', 'AIToolCurrently Using']]

database = {'demographics': df_demographics, 'learn_code': df_learn_code, 'language': df_language, 'ai': df_ai}

def find_semicolons(dataframe):
    result = []

    firstFifty = dataframe.head(50)

    for column in firstFifty.columns:
        if firstFifty[column].apply(lambda x: ';' in str(x)).any():
            result.append(column)

    return result


def transform_dataframe(dataframe):
    result = find_semicolons(dataframe)

    for column in result:
        values = [str(x).split(';') for x in dataframe[column].unique().tolist()]
        flat_values = []
        for x in values:
            flat_values.extend(x)
        flat_values = set(flat_values)
        for x in flat_values:
            dataframe[x] = dataframe[column].str.contains(x, na=False).astype(int)



for x in database:
    transform_dataframe(database.get(x))
    database.get(x).to_csv(x + '.csv')

Here's the traceback

Traceback (most recent call last):
  File "/Users/shalim/PycharmProjects/work/stackoverflow.py", line 45, in <module>
    transform_dataframe(database.get(x))
  File "/Users/shalim/PycharmProjects/work/stackoverflow.py", line 40, in transform_dataframe
    dataframe[x] = dataframe[column].str.contains(x, na=False).astype(int)
  File "/Users/shalim/PycharmProjects/work/venv/lib/python3.9/site-packages/pandas/core/strings/accessor.py", line 137, in wrapper
    return func(self, *args, **kwargs)
  File "/Users/shalim/PycharmProjects/work/venv/lib/python3.9/site-packages/pandas/core/strings/accessor.py", line 1327, in contains
    if regex and repile(pat).groups:
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/re.py", line 252, in compile
    return _compile(pattern, flags)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/re.py", line 304, in _compile
    p = sre_compilepile(pattern, flags)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_parse.py", line 948, in parse
    p = _parse_sub(source, state, flags & SRE_FLAG_VERBOSE, 0)
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_parse.py", line 443, in _parse_sub
    itemsappend(_parse(source, state, verbose, nested + 1,
  File "/Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.9/lib/python3.9/sre_parse.py", line 671, in _parse
    raise source.error("multiple repeat",
re.error: multiple repeat at position 2

Share Improve this question edited Jan 18 at 15:13 asked Jan 18 at 15:08 m. lekk 7811 gold badge5 silver badges13 bronze badges

Post traceback error, please – toyota Supra Commented Jan 18 at 15:12
1 @toyotaSupra sorry, fot about that. – m. lekk Commented Jan 18 at 15:13

Add a comment |

1 Answer 1

Sorted by: Reset to default 0

Pandas .str.contains performs a regex search rather than a substring search, by default. That means that characters like * or + get treated as regex metacharacters instead of a literal asterisk or plus sign.

It looks like you're trying to perform a substring search, not a regex search. Your x isn't a valid regex, and even if it was, it wouldn't mean what you want. You need to specify regex=False:

dataframe[x] = dataframe[column].str.contains(x, na=False, regex=False).astype(int)

本文标签：

版权声明：本文标题：python - Why am I getting "raise source.error("multiple repeat", re.error: multiple repeat at positio 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.betaflare.com/web/1742067765a2418937.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

编程频道|软件玩家 - 软件改变生活！

python - Why am I getting &quot;raise source.error(&quot;multiple repeat&quot;, re.error: multiple repeat at positio

1 Answer 1

更多相关文章

javascript - Chrome Dev Tools Cannot Expand Iframe contents - Stack Overflow

html - calling Javascript function in JSP - Stack Overflow

jquery - Add ID to Button in Javascript - Stack Overflow

Word VBA: Search for 13-digit UNIX Timestamp and Add Conventional Time Format After Timestamp - Loop Isn&#39;t Working As In

plugins - Always get &lt;errno: 150 &quot;Foreign key constraint is incorrectly formed&quot;&gt; creating a new

javascript - Safari and Chrome doesn&#39;t evaluate dynamically added &lt;script&gt; tag at page load - Stack Overfl

excel - How can I get VBA code to recognise a worksheet and copy to it - Stack Overflow

javascript - How can I make a plain text paste in a contentEditable span without breaking undo? - Stack Overflow

javascript - How to determine if a user is actually looking at a web page? - Stack Overflow

How to do partial re-renders in rust Yew - Stack Overflow

javascript - Uncaught TypeError: Cannot set property &#39;action&#39; of undefined - Stack Overflow

javascript - regex - only allow English(lower or upper), numbers, special characters - Stack Overflow

javascript - How to add background color using tailwind when i have the hex code for the color? - Stack Overflow

vb.net - Trouble with Filtering a .NET DataTable - Stack Overflow

javascript - How to retrieve user avatar from a Trello API? - Stack Overflow

vue.js - laravelvue design: different ways to handle a loader on a SPA while laravel is processing a job - Stack Overflow

c# - .NET database scaffolding: build step fails with unsupported &quot;ResolveComReference&quot; (.NET core vs .NET fra

javascript - Saving table data to HTML5 LocalStorage - Stack Overflow

algorithm - Optimize &quot;diff&quot; movement over spatial grid - Stack Overflow

customization - Measure time in ONLY HOUR format

发表评论

推荐文章

javascript - Shrink the size of bars in simple bar charts in amcharts - Stack Overflow

javascript - Searching the DOM for multiples of the same string, using XPath - Stack Overflow

javascript - Searching on multiple reference fields in contentful - Stack Overflow

regex - Javascript replace opening and closing brackets - Stack Overflow

python - How do I ignore case of double-dash options (long-options) in argparse? - Stack Overflow

热门文章

c# - How to apply textbox blank validation on button click inside gridview in asp.net using javascript? - Stack Overflow

javascript - stop form during submission if it validates incorrectly - Stack Overflow

javascript - Display only a single state with counties from a full US counties map - Stack Overflow

javascript - Creating a &quot;hole&quot; with 0 opacity inside a container with color - css on react native (Layout for

Attachment pages stealing page slugs

customization - Block direct access to thank you pages

javascript - Extending a custom Backbone.Marionette view. How to implicitly incur prototype&#39;s eventsonRender? - Stack Ov

javascript - Package html, js, css as a desktop app - Stack Overflow

power automate - Do until only showing 1 iteration when there should be hundreds - Stack Overflow

Does Wordpress provide different levels of logging?

最新文章

ESXI 安装教程(2) ---​ESXI​系统安装

hpoem系统服务器,hp（惠普）Windows 7 3264位-OEM版

Windows中给文件夹添加备注

制作Winpe启动盘多种方法:一篇文章让你从小白变高手

Vue后台管理系统项目(2)后台管理系统模板介绍

plugin development - By adding &quot;?login - failed&quot; code unable to access my dashboard

javascript - JQuery Alertify confirm dialog box not working properly - Stack Overflow

javascript - React Autosuggest access value of input - Stack Overflow

Android Compose UiState not updated - Stack Overflow

javascript - New line in Full Calendar description - Stack Overflow

惠普OMEN 15-CE001TX 2EF91PA参数报价

苹果新款MacBook Pro 15英寸 i732GB1TBVega Pro 20参数报价

联想Y330A-PSE L参数报价

神舟战神Z7 D6 i7-12650H16GB512GBRTX4050旗舰版参数报价

神舟战神Z7 D6 i7-12650H16GB1TBRTX4050参数报价

python - Why am I getting "raise source.error("multiple repeat", re.error: multiple repeat at positio

Word VBA: Search for 13-digit UNIX Timestamp and Add Conventional Time Format After Timestamp - Loop Isn't Working As In

plugins - Always get <errno: 150 "Foreign key constraint is incorrectly formed"> creating a new

javascript - Safari and Chrome doesn't evaluate dynamically added <script> tag at page load - Stack Overfl

javascript - Uncaught TypeError: Cannot set property 'action' of undefined - Stack Overflow

c# - .NET database scaffolding: build step fails with unsupported "ResolveComReference" (.NET core vs .NET fra

algorithm - Optimize "diff" movement over spatial grid - Stack Overflow

javascript - Creating a "hole" with 0 opacity inside a container with color - css on react native (Layout for

javascript - Extending a custom Backbone.Marionette view. How to implicitly incur prototype's eventsonRender? - Stack Ov

ESXI 安装教程(2) ---ESXI系统安装

plugin development - By adding "?login - failed" code unable to access my dashboard