FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3890, 639 aa 1>>>pF1KE3890 639 - 639 aa - 639 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.2493+/-0.000984; mu= -12.1905+/- 0.060 mean_var=349.4639+/-70.109, 0's: 0 Z-trim(114.6): 65 B-trim: 0 in 0/56 Lambda= 0.068608 statistics sampled from 15271 (15327) to 15271 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.752), E-opt: 0.2 (0.459), width: 16 Scan time: 1.980 The best scores are: opt bits E(33420) CCDS34472.1 CD2AP gene_id:23607|Hs109|chr6 ( 639) 4193 429.0 9.9e-120 CCDS14193.1 SH3KBP1 gene_id:30011|Hs109|chrX ( 665) 1125 125.3 2.7e-28 CCDS35213.1 SH3KBP1 gene_id:30011|Hs109|chrX ( 628) 878 100.9 5.8e-21 >>CCDS34472.1 CD2AP gene_id:23607|Hs109|chr6 (639 aa) initn: 4193 init1: 4193 opt: 4193 Z-score: 2263.2 bits: 429.0 E(33420): 9.9e-120 Smith-Waterman score: 4193; 100.0% identity (100.0% similar) in 639 aa overlap (1-639:1-639) 10 20 30 40 50 60 pF1KE3 MVDYIVEYDYDAVHDDELTIRVGEIIRNVKKLQEEGWLEGELNGRRGMFPDNFVKEIKRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MVDYIVEYDYDAVHDDELTIRVGEIIRNVKKLQEEGWLEGELNGRRGMFPDNFVKEIKRE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 TEFKDDSLPIKRERHGNVASLVQRISTYGLPAGGIQPHPQTKNIKKKTKKRQCKVLFEYI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TEFKDDSLPIKRERHGNVASLVQRISTYGLPAGGIQPHPQTKNIKKKTKKRQCKVLFEYI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 PQNEDELELKVGDIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQDDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PQNEDELELKVGDIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQDDS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 ETVLAGPTSPIPSLGNVSETASGSVTQPKKIRGIGFGDIFKEGSVKLRTRTSSSETEEKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ETVLAGPTSPIPSLGNVSETASGSVTQPKKIRGIGFGDIFKEGSVKLRTRTSSSETEEKK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 PEKPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDELTFKEGEIIHLIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PEKPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDELTFKEGEIIHLIS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 KETGEAGWWRGELNGKEGVFPDNFAVQINELDKDFPKPKKPPPPAKAPAPKPELIAAEKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KETGEAGWWRGELNGKEGVFPDNFAVQINELDKDFPKPKKPPPPAKAPAPKPELIAAEKK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 YFSLKPEEKDEKSTLEQKPSKPAAPQVPPKKPTPPTKASNLLRSSGTVYPKRPEKPVPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YFSLKPEEKDEKSTLEQKPSKPAAPQVPPKKPTPPTKASNLLRSSGTVYPKRPEKPVPPP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 PPIAKINGEVSSISSKFETEPVSKLKLDSEQLPLRPKSVDFDSLTVRTSKETDVVNFDDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PPIAKINGEVSSISSKFETEPVSKLKLDSEQLPLRPKSVDFDSLTVRTSKETDVVNFDDI 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 ASSENLLHLTANRPKMPGRRLPGRFNGGHSPTHSPEKILKLPKEEDSANLKPSELKKDTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 ASSENLLHLTANRPKMPGRRLPGRFNGGHSPTHSPEKILKLPKEEDSANLKPSELKKDTC 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 YSPKPSVYLSTPSSASKANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIELLCIVEAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 YSPKPSVYLSTPSSASKANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIELLCIVEAL 550 560 570 580 590 600 610 620 630 pF1KE3 KKDHGKELEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS ::::::::::::::::::::::::::::::::::::::: CCDS34 KKDHGKELEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS 610 620 630 >>CCDS14193.1 SH3KBP1 gene_id:30011|Hs109|chrX (665 aa) initn: 894 init1: 333 opt: 1125 Z-score: 621.8 bits: 125.3 E(33420): 2.7e-28 Smith-Waterman score: 1343; 37.8% identity (62.7% similar) in 706 aa overlap (1-638:1-664) 10 20 30 40 50 60 pF1KE3 MVDYIVEYDYDAVHDDELTIRVGEIIRNVKKLQEEGWLEGELNGRRGMFPDNFVKEIKRE ::. :::.::.: ::::::: ::::: :..: .. :: ::..:::::.::::::.:::.: CCDS14 MVEAIVEFDYQAQHDDELTISVGEIITNIRK-EDGGWWEGQINGRRGLFPDNFVREIKKE 10 20 30 40 50 70 80 90 100 110 pF1KE3 TEFKDDSLPIKRERHGNVASLVQRISTYGLPAGGIQPHPQT---KNIKKKTKKRQCKVLF .: : : : .. . .:.:. .: : . . ..:.:.: : CCDS14 --MKKDPLTNKAPEK----------PLHEVPSGNSLLSSETILRTNKRGERRRRRCQVAF 60 70 80 90 100 120 130 140 150 160 170 pF1KE3 EYIPQNEDELELKVGDIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQ :.:::.:::::::::::.. ::::::: :.::.: :.:::::.::: .: : .: CCDS14 SYLPQNDDELELKVGDIIEVVGEVEEGWWEGVLNGKTGMFPSNFIKELSGESD-ELGISQ 110 120 130 140 150 160 180 190 200 210 220 pF1KE3 DD--SETVLAGPTSPIPSLGNVSET----ASGSVT----QPKKIRGIGFGDIFKEGSVKL :. :.. : :. . :. : : :.:.:. ::::..:.:::::::. .:: CCDS14 DEQLSKSSLRETTGSESDGGDSSSTKSEGANGTVATAAIQPKKVKGVGFGDIFKDKPIKL 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE3 RTRTSSSETEEKKPEKPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDE : :. :.. :: : ..: : . . .::. ... :.:.::...: ::. :.:: CCDS14 RPRSIEVENDFLPVEKT-IGKKLPATTATPDSSKTEMDSRTKSKDYCKVIFPYEAQNDDE 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 LTFKEGEIIHLISKETGEAGWWRGELNGKEGVFPDNFAVQIN-ELDKDFPKPKKPPPPAK ::.:::.:. ::.:. ..:::.:::::..:::::::. . ...:. .:::::::. CCDS14 LTIKEGDIVTLINKDCIDVGWWEGELNGRRGVFPDNFVKLLPPDFEKEGNRPKKPPPPS- 290 300 310 320 330 340 350 360 370 380 390 pF1KE3 APAPKPELIAAEKKYFSLK---------PEEKDEKSTLEQKPS----KPAAPQVPPKKPT ::. : ..:.:. : :.. .:: :..:. ::..: .::::: CCDS14 APVIKQGAGTTERKHEIKKIPPERPEMLPNRTEEKERPEREPKLDLQKPSVPAIPPKKPR 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE3 PPTKASNLLRSSGTVYPKRPEKPVPPPPPIAKINGEVSSISSKFETEPVSKLKLDSEQLP :: .: : :.. :.:::.:: : ... . :: .. CCDS14 PPK--TNSLSRPGALPPRRPERPVGP----------------------LTHTRGDSPKID 410 420 430 440 460 470 480 490 500 pF1KE3 LRPKSVD--FDSLTVRTSKETDVVNFDDIASS-ENLLHLTANRPKMPGRRLPGR------ : .:.. .:. :.. :. .::...:: :.: : :..::: ::: :.. CCDS14 LAGSSLSGILDKDLSDRSNDIDLEGFDSVVSSTEKLSHPTTSRPKATGRRPPSQSLTSSS 450 460 470 480 490 500 510 520 530 540 pF1KE3 ------FNGGHSPTHSPEKILKLPKEEDSANLKPSELKKDTCYS-------PKPSVY--- :.. :: .. :. ..: .. .:. : :. . : :::... CCDS14 LSSPDIFDSP-SPEEDKEEHISLAHRGVDASKKTSKTVTISQVSDNKASLPPKPGTMAAG 510 520 530 540 550 550 560 570 580 590 pF1KE3 ------LST----PSSAS------KANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIE ::. : :.: .::. . : : : :.: .. ...:::.:. : CCDS14 GGGPAPLSSAAPSPLSSSLGTAGHRANSPS-LFGTEGKPKMEPAASSQAAVEELRTQVRE 560 570 580 590 600 610 600 610 620 630 pF1KE3 LLCIVEALKKDHGKELEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS : :.:..: .. .:...: ..:.::: .: :.::.. .:::. : CCDS14 LRSIIETMKDQQKREIKQLLSELDEEKKIRLRLQMEVNDIKKALQSK 620 630 640 650 660 >>CCDS35213.1 SH3KBP1 gene_id:30011|Hs109|chrX (628 aa) initn: 702 init1: 333 opt: 878 Z-score: 490.1 bits: 100.9 E(33420): 5.8e-21 Smith-Waterman score: 1088; 36.4% identity (62.4% similar) in 601 aa overlap (103-638:56-627) 80 90 100 110 120 130 pF1KE3 ERHGNVASLVQRISTYGLPAGGIQPHPQTKNIKKKTKKRQCKVLFEYIPQNEDELELKVG : . . ..:.:.: : :.:::.:::::::: CCDS35 DPLTNKAPEKPLHEVPSGNSLLSSETILRTNKRGERRRRRCQVAFSYLPQNDDELELKVG 30 40 50 60 70 80 140 150 160 170 180 190 pF1KE3 DIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQDD--SETVLAGPTSP :::.. ::::::: :.::.: :.:::::.::: .: : .::. :.. : :. CCDS35 DIIEVVGEVEEGWWEGVLNGKTGMFPSNFIKELSGESD-ELGISQDEQLSKSSLRETTGS 90 100 110 120 130 140 200 210 220 230 240 pF1KE3 IPSLGNVSET----ASGSVT----QPKKIRGIGFGDIFKEGSVKLRTRTSSSETEEKKPE . :. : : :.:.:. ::::..:.:::::::. .::: :. :.. : CCDS35 ESDGGDSSSTKSEGANGTVATAAIQPKKVKGVGFGDIFKDKPIKLRPRSIEVENDFLPVE 150 160 170 180 190 200 250 260 270 280 290 300 pF1KE3 KPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDELTFKEGEIIHLISKE : : ..: : . . .::. ... :.:.::...: ::. :.::::.:::.:. ::.:. CCDS35 KT-IGKKLPATTATPDSSKTEMDSRTKSKDYCKVIFPYEAQNDDELTIKEGDIVTLINKD 210 220 230 240 250 260 310 320 330 340 350 360 pF1KE3 TGEAGWWRGELNGKEGVFPDNFAVQIN-ELDKDFPKPKKPPPPAKAPAPKPELIAAEKKY ..:::.:::::..:::::::. . ...:. .:::::::. ::. : ..:.:. CCDS35 CIDVGWWEGELNGRRGVFPDNFVKLLPPDFEKEGNRPKKPPPPS-APVIKQGAGTTERKH 270 280 290 300 310 320 370 380 390 400 pF1KE3 FSLK---------PEEKDEKSTLEQKPS----KPAAPQVPPKKPTPPTKASNLLRSSGTV : :.. .:: :..:. ::..: .::::: :: .: : :.. CCDS35 EIKKIPPERPEMLPNRTEEKERPEREPKLDLQKPSVPAIPPKKPRPPK--TNSLSRPGAL 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE3 YPKRPEKPVPPPPPIAKINGEVSSISSKFETEPVSKLKLDSEQLPLRPKSVD--FDSLTV :.:::.:: : ... . :: .. : .:.. .:. CCDS35 PPRRPERPVGP----------------------LTHTRGDSPKIDLAGSSLSGILDKDLS 390 400 410 470 480 490 500 510 pF1KE3 RTSKETDVVNFDDIASS-ENLLHLTANRPKMPGRRLPGR------------FNGGHSPTH :.. :. .::...:: :.: : :..::: ::: :.. :.. :: . CCDS35 DRSNDIDLEGFDSVVSSTEKLSHPTTSRPKATGRRPPSQSLTSSSLSSPDIFDSP-SPEE 420 430 440 450 460 470 520 530 540 550 pF1KE3 SPEKILKLPKEEDSANLKPSELKKDTCYS-------PKPSVY---------LST----PS . :. ..: .. .:. : :. . : :::... ::. : CCDS35 DKEEHISLAHRGVDASKKTSKTVTISQVSDNKASLPPKPGTMAAGGGGPAPLSSAAPSPL 480 490 500 510 520 530 560 570 580 590 600 pF1KE3 SAS------KANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIELLCIVEALKKDHGKE :.: .::. . : : : :.: .. ...:::.:. :: :.:..: .. .: CCDS35 SSSLGTAGHRANSPS-LFGTEGKPKMEPAASSQAAVEELRTQVRELRSIIETMKDQQKRE 540 550 560 570 580 590 610 620 630 pF1KE3 LEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS ...: ..:.::: .: :.::.. .:::. : CCDS35 IKQLLSELDEEKKIRLRLQMEVNDIKKALQSK 600 610 620 639 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Aug 4 20:42:20 2021 done: Wed Aug 4 20:42:20 2021 Total Scan time: 1.980 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]