Use Series.str.extract
with DataFrame.pop
for extract column:
pat = r'([\x00-\x7F]+)([\u4e00-\u9fff]+.*$)'
df[['office_name','company_info']] = df.pop('company_info').str.extract(pat)
print (df)
id office_name company_info
0 1 05B01 北京企商联登记注册代理事务所(通合伙)
1 2 Unit-D 608 华夏启商(北京企业管理有限公司)
2 3 1004-1005 北京中睿智诚商业管理有限公司
3 4 17/F(1706) 北京美泰德商务咨询有限公司
4 5 A2006~A2007 北京新曙光会计服务有限公司
5 6 2906-10 中国建筑与室内设计师网
11
solved Extract numbers, letters, or punctuation from left side of string column in Python