内存不够时,替代sns.countplot()的实现方法
最近做EDA的的时候会存在这样一种情况,数据量过大时,直接使用sns.countplot()
内存很容易直接被榨干掉。
暂时没想清为什么会直接占用那么多内存,应该去StackOverflow提个Q的。
不过想了下又查了下StackOverflow,应该有用df.value_counts() 和
matplotlib
来实现sns.countplot()
的实现方法,如此,What is Matplotlib's alternative for countplot from seaborn?
引用自StackOverflow,ImportanceOfBeingErnest
Say you have this data:
1 | import numpy as np; np.random.seed(42) |
You can plot a countplot in seaborn as
1 | import seaborn as sns |

Or you can create a bar plot in pandas
1 | df["Sex"].value_counts().plot.bar() |
![df[Sex].value_counts().plot.bar()](/2019/06/24/内存不够时,替代sns-countplot-的实现方法/06/24/内存不够时,替代sns-countplot-的实现方法/plt_bar.jpg)
Or you can create a bar plot in matplotlib
1 | counts = df["Sex"].value_counts() |
![plt.bar(df[Sex].value_counts().index, df[Sex].value_counts().values)](/2019/06/24/内存不够时,替代sns-countplot-的实现方法/06/24/内存不够时,替代sns-countplot-的实现方法/value_counts_plot_bar.jpg)