FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3890, 639 aa
1>>>pF1KE3890 639 - 639 aa - 639 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.2493+/-0.000984; mu= -12.1905+/- 0.060
mean_var=349.4639+/-70.109, 0's: 0 Z-trim(114.6): 65 B-trim: 0 in 0/56
Lambda= 0.068608
statistics sampled from 15271 (15327) to 15271 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.752), E-opt: 0.2 (0.459), width: 16
Scan time: 1.980
The best scores are: opt bits E(33420)
CCDS34472.1 CD2AP gene_id:23607|Hs109|chr6 ( 639) 4193 429.0 9.9e-120
CCDS14193.1 SH3KBP1 gene_id:30011|Hs109|chrX ( 665) 1125 125.3 2.7e-28
CCDS35213.1 SH3KBP1 gene_id:30011|Hs109|chrX ( 628) 878 100.9 5.8e-21
>>CCDS34472.1 CD2AP gene_id:23607|Hs109|chr6 (639 aa)
initn: 4193 init1: 4193 opt: 4193 Z-score: 2263.2 bits: 429.0 E(33420): 9.9e-120
Smith-Waterman score: 4193; 100.0% identity (100.0% similar) in 639 aa overlap (1-639:1-639)
10 20 30 40 50 60
pF1KE3 MVDYIVEYDYDAVHDDELTIRVGEIIRNVKKLQEEGWLEGELNGRRGMFPDNFVKEIKRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MVDYIVEYDYDAVHDDELTIRVGEIIRNVKKLQEEGWLEGELNGRRGMFPDNFVKEIKRE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 TEFKDDSLPIKRERHGNVASLVQRISTYGLPAGGIQPHPQTKNIKKKTKKRQCKVLFEYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TEFKDDSLPIKRERHGNVASLVQRISTYGLPAGGIQPHPQTKNIKKKTKKRQCKVLFEYI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 PQNEDELELKVGDIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQDDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PQNEDELELKVGDIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQDDS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 ETVLAGPTSPIPSLGNVSETASGSVTQPKKIRGIGFGDIFKEGSVKLRTRTSSSETEEKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ETVLAGPTSPIPSLGNVSETASGSVTQPKKIRGIGFGDIFKEGSVKLRTRTSSSETEEKK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 PEKPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDELTFKEGEIIHLIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PEKPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDELTFKEGEIIHLIS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 KETGEAGWWRGELNGKEGVFPDNFAVQINELDKDFPKPKKPPPPAKAPAPKPELIAAEKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KETGEAGWWRGELNGKEGVFPDNFAVQINELDKDFPKPKKPPPPAKAPAPKPELIAAEKK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 YFSLKPEEKDEKSTLEQKPSKPAAPQVPPKKPTPPTKASNLLRSSGTVYPKRPEKPVPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YFSLKPEEKDEKSTLEQKPSKPAAPQVPPKKPTPPTKASNLLRSSGTVYPKRPEKPVPPP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 PPIAKINGEVSSISSKFETEPVSKLKLDSEQLPLRPKSVDFDSLTVRTSKETDVVNFDDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PPIAKINGEVSSISSKFETEPVSKLKLDSEQLPLRPKSVDFDSLTVRTSKETDVVNFDDI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 ASSENLLHLTANRPKMPGRRLPGRFNGGHSPTHSPEKILKLPKEEDSANLKPSELKKDTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 ASSENLLHLTANRPKMPGRRLPGRFNGGHSPTHSPEKILKLPKEEDSANLKPSELKKDTC
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 YSPKPSVYLSTPSSASKANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIELLCIVEAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 YSPKPSVYLSTPSSASKANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIELLCIVEAL
550 560 570 580 590 600
610 620 630
pF1KE3 KKDHGKELEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS
:::::::::::::::::::::::::::::::::::::::
CCDS34 KKDHGKELEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS
610 620 630
>>CCDS14193.1 SH3KBP1 gene_id:30011|Hs109|chrX (665 aa)
initn: 894 init1: 333 opt: 1125 Z-score: 621.8 bits: 125.3 E(33420): 2.7e-28
Smith-Waterman score: 1343; 37.8% identity (62.7% similar) in 706 aa overlap (1-638:1-664)
10 20 30 40 50 60
pF1KE3 MVDYIVEYDYDAVHDDELTIRVGEIIRNVKKLQEEGWLEGELNGRRGMFPDNFVKEIKRE
::. :::.::.: ::::::: ::::: :..: .. :: ::..:::::.::::::.:::.:
CCDS14 MVEAIVEFDYQAQHDDELTISVGEIITNIRK-EDGGWWEGQINGRRGLFPDNFVREIKKE
10 20 30 40 50
70 80 90 100 110
pF1KE3 TEFKDDSLPIKRERHGNVASLVQRISTYGLPAGGIQPHPQT---KNIKKKTKKRQCKVLF
.: : : : .. . .:.:. .: : . . ..:.:.: :
CCDS14 --MKKDPLTNKAPEK----------PLHEVPSGNSLLSSETILRTNKRGERRRRRCQVAF
60 70 80 90 100
120 130 140 150 160 170
pF1KE3 EYIPQNEDELELKVGDIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQ
:.:::.:::::::::::.. ::::::: :.::.: :.:::::.::: .: : .:
CCDS14 SYLPQNDDELELKVGDIIEVVGEVEEGWWEGVLNGKTGMFPSNFIKELSGESD-ELGISQ
110 120 130 140 150 160
180 190 200 210 220
pF1KE3 DD--SETVLAGPTSPIPSLGNVSET----ASGSVT----QPKKIRGIGFGDIFKEGSVKL
:. :.. : :. . :. : : :.:.:. ::::..:.:::::::. .::
CCDS14 DEQLSKSSLRETTGSESDGGDSSSTKSEGANGTVATAAIQPKKVKGVGFGDIFKDKPIKL
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE3 RTRTSSSETEEKKPEKPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDE
: :. :.. :: : ..: : . . .::. ... :.:.::...: ::. :.::
CCDS14 RPRSIEVENDFLPVEKT-IGKKLPATTATPDSSKTEMDSRTKSKDYCKVIFPYEAQNDDE
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE3 LTFKEGEIIHLISKETGEAGWWRGELNGKEGVFPDNFAVQIN-ELDKDFPKPKKPPPPAK
::.:::.:. ::.:. ..:::.:::::..:::::::. . ...:. .:::::::.
CCDS14 LTIKEGDIVTLINKDCIDVGWWEGELNGRRGVFPDNFVKLLPPDFEKEGNRPKKPPPPS-
290 300 310 320 330 340
350 360 370 380 390
pF1KE3 APAPKPELIAAEKKYFSLK---------PEEKDEKSTLEQKPS----KPAAPQVPPKKPT
::. : ..:.:. : :.. .:: :..:. ::..: .:::::
CCDS14 APVIKQGAGTTERKHEIKKIPPERPEMLPNRTEEKERPEREPKLDLQKPSVPAIPPKKPR
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE3 PPTKASNLLRSSGTVYPKRPEKPVPPPPPIAKINGEVSSISSKFETEPVSKLKLDSEQLP
:: .: : :.. :.:::.:: : ... . :: ..
CCDS14 PPK--TNSLSRPGALPPRRPERPVGP----------------------LTHTRGDSPKID
410 420 430 440
460 470 480 490 500
pF1KE3 LRPKSVD--FDSLTVRTSKETDVVNFDDIASS-ENLLHLTANRPKMPGRRLPGR------
: .:.. .:. :.. :. .::...:: :.: : :..::: ::: :..
CCDS14 LAGSSLSGILDKDLSDRSNDIDLEGFDSVVSSTEKLSHPTTSRPKATGRRPPSQSLTSSS
450 460 470 480 490 500
510 520 530 540
pF1KE3 ------FNGGHSPTHSPEKILKLPKEEDSANLKPSELKKDTCYS-------PKPSVY---
:.. :: .. :. ..: .. .:. : :. . : :::...
CCDS14 LSSPDIFDSP-SPEEDKEEHISLAHRGVDASKKTSKTVTISQVSDNKASLPPKPGTMAAG
510 520 530 540 550
550 560 570 580 590
pF1KE3 ------LST----PSSAS------KANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIE
::. : :.: .::. . : : : :.: .. ...:::.:. :
CCDS14 GGGPAPLSSAAPSPLSSSLGTAGHRANSPS-LFGTEGKPKMEPAASSQAAVEELRTQVRE
560 570 580 590 600 610
600 610 620 630
pF1KE3 LLCIVEALKKDHGKELEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS
: :.:..: .. .:...: ..:.::: .: :.::.. .:::. :
CCDS14 LRSIIETMKDQQKREIKQLLSELDEEKKIRLRLQMEVNDIKKALQSK
620 630 640 650 660
>>CCDS35213.1 SH3KBP1 gene_id:30011|Hs109|chrX (628 aa)
initn: 702 init1: 333 opt: 878 Z-score: 490.1 bits: 100.9 E(33420): 5.8e-21
Smith-Waterman score: 1088; 36.4% identity (62.4% similar) in 601 aa overlap (103-638:56-627)
80 90 100 110 120 130
pF1KE3 ERHGNVASLVQRISTYGLPAGGIQPHPQTKNIKKKTKKRQCKVLFEYIPQNEDELELKVG
: . . ..:.:.: : :.:::.::::::::
CCDS35 DPLTNKAPEKPLHEVPSGNSLLSSETILRTNKRGERRRRRCQVAFSYLPQNDDELELKVG
30 40 50 60 70 80
140 150 160 170 180 190
pF1KE3 DIIDINEEVEEGWWSGTLNNKLGLFPSNFVKELEVTDDGETHEAQDD--SETVLAGPTSP
:::.. ::::::: :.::.: :.:::::.::: .: : .::. :.. : :.
CCDS35 DIIEVVGEVEEGWWEGVLNGKTGMFPSNFIKELSGESD-ELGISQDEQLSKSSLRETTGS
90 100 110 120 130 140
200 210 220 230 240
pF1KE3 IPSLGNVSET----ASGSVT----QPKKIRGIGFGDIFKEGSVKLRTRTSSSETEEKKPE
. :. : : :.:.:. ::::..:.:::::::. .::: :. :.. :
CCDS35 ESDGGDSSSTKSEGANGTVATAAIQPKKVKGVGFGDIFKDKPIKLRPRSIEVENDFLPVE
150 160 170 180 190 200
250 260 270 280 290 300
pF1KE3 KPLILQSLGPKTQSVEITKTDTEGKIKAKEYCRTLFAYEGTNEDELTFKEGEIIHLISKE
: : ..: : . . .::. ... :.:.::...: ::. :.::::.:::.:. ::.:.
CCDS35 KT-IGKKLPATTATPDSSKTEMDSRTKSKDYCKVIFPYEAQNDDELTIKEGDIVTLINKD
210 220 230 240 250 260
310 320 330 340 350 360
pF1KE3 TGEAGWWRGELNGKEGVFPDNFAVQIN-ELDKDFPKPKKPPPPAKAPAPKPELIAAEKKY
..:::.:::::..:::::::. . ...:. .:::::::. ::. : ..:.:.
CCDS35 CIDVGWWEGELNGRRGVFPDNFVKLLPPDFEKEGNRPKKPPPPS-APVIKQGAGTTERKH
270 280 290 300 310 320
370 380 390 400
pF1KE3 FSLK---------PEEKDEKSTLEQKPS----KPAAPQVPPKKPTPPTKASNLLRSSGTV
: :.. .:: :..:. ::..: .::::: :: .: : :..
CCDS35 EIKKIPPERPEMLPNRTEEKERPEREPKLDLQKPSVPAIPPKKPRPPK--TNSLSRPGAL
330 340 350 360 370 380
410 420 430 440 450 460
pF1KE3 YPKRPEKPVPPPPPIAKINGEVSSISSKFETEPVSKLKLDSEQLPLRPKSVD--FDSLTV
:.:::.:: : ... . :: .. : .:.. .:.
CCDS35 PPRRPERPVGP----------------------LTHTRGDSPKIDLAGSSLSGILDKDLS
390 400 410
470 480 490 500 510
pF1KE3 RTSKETDVVNFDDIASS-ENLLHLTANRPKMPGRRLPGR------------FNGGHSPTH
:.. :. .::...:: :.: : :..::: ::: :.. :.. :: .
CCDS35 DRSNDIDLEGFDSVVSSTEKLSHPTTSRPKATGRRPPSQSLTSSSLSSPDIFDSP-SPEE
420 430 440 450 460 470
520 530 540 550
pF1KE3 SPEKILKLPKEEDSANLKPSELKKDTCYS-------PKPSVY---------LST----PS
. :. ..: .. .:. : :. . : :::... ::. :
CCDS35 DKEEHISLAHRGVDASKKTSKTVTISQVSDNKASLPPKPGTMAAGGGGPAPLSSAAPSPL
480 490 500 510 520 530
560 570 580 590 600
pF1KE3 SAS------KANTTAFLTPLEIKAKVETDDVKKNSLDELRAQIIELLCIVEALKKDHGKE
:.: .::. . : : : :.: .. ...:::.:. :: :.:..: .. .:
CCDS35 SSSLGTAGHRANSPS-LFGTEGKPKMEPAASSQAAVEELRTQVRELRSIIETMKDQQKRE
540 550 560 570 580 590
610 620 630
pF1KE3 LEKLRKDLEEEKTMRSNLEMEIEKLKKAVLSS
...: ..:.::: .: :.::.. .:::. :
CCDS35 IKQLLSELDEEKKIRLRLQMEVNDIKKALQSK
600 610 620
639 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Aug 4 20:42:20 2021 done: Wed Aug 4 20:42:20 2021
Total Scan time: 1.980 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]