前言
最近在工作經常會碰到對字符串進行去重操作,下面就給大家列出用Python如何處理的,話不多說了,來壹起看看詳細的介紹吧。
比如說,要拿下面的字符傳去掉重復的AA, A(B,C)
S = 'AA, BB, EE, DD, AA, A(B,C), CC, A(B,C)'
代碼如下:
備註:
1. 用str.split(',')只能分隔逗號壹種;如果涉及到多重分隔的話就需要使用re.split(',|:')
2. 原字符串以逗號分隔的,後面有壹個或多個字符串,所以re.split(', | ')
3. 執行re.split(r', | ', S)操作之後,列表中會產生大量的'',就需要將filter過濾掉
4. 使用L.count(x) == 1 或者 L.count(x) > 1來保留重復項或,非重復項
5. set(L)則是保留列表中的唯壹項,再用list()將其轉換為列表
6. 使用 ', '.join(L) ,將列表拼接成我們想要的字符串
總結
借助於python中的正則表達式(re),及列表,字符串,集合的等操作,來處理字符串還是很靈活的!